#1 - 2019-9-21 21:27
君寻 (已淡出bgm38)
因为做这个组件的需要,我目前正在添加获取Tag时的同义标签合并功能,以bgm标记数最多的为主意项(还是以标准格式为主意项),现在设置的同义标签项如下:
欢迎大家提供动画标签(标记数>500)和书籍、音乐、游戏等标签(标记数>100)的消歧义项

{"TVA":"TV","TV动画":"TV","漫改":"漫画改","漫画改编":"漫画改","轻改":"轻小说改","轻小说改编":"轻小说改","原创动画":"原创","京都动画":"京阿尼","京都":"京阿尼","京都アニメーション":"京阿尼","ProductionI.G":"Production.I.G","Production_I.G":"Production.I.G","Production.IG":"Production.I.G","ProductionIG":"Production.I.G","I.G":"Production.I.G","ProductionIMS":"Production.IMS","key社":"key","骨头社":"BONES","日升":"SUNRISE","GANAIX":"GAINAX"," 東映アニメーション":"东映","国产动画":"国产","日本动画":"日本","日本漫画":"日本","SF":"科幻","治愈系":"治愈","泡面":"泡面番","宫崎峻":"宫崎骏","宮崎駿":"宫崎骏","花澤香菜":"花泽香菜","香菜":"花泽香菜","钉宫":"钉宫理惠","钉宫病":"钉宫理惠","冈田磨里":"冈田麿里","奈须きのこ":"奈须蘑菇","名侦探柯南":"柯南","名探偵コナン":"柯南","コミック":"漫画","マンガ":"漫画","成年コミック":"成人漫画","BLコミック":"BL漫画","少女漫画":"少女漫","东方":"東方","東方project":"東方","东方project":"東方","講談社":"讲谈社","漫画単行本":"漫画单行本","西尾維新":"西尾维新","同人音乐":"同人","同人音樂":"同人","澤野弘之":"泽野弘之","梶浦由記":"梶浦由记","石黒正数":"石黑正数","劇場版":"剧场版","劇場版アニメ":"剧场版","Diomedea":"Diomedéa","KINEMACITRUS":"KINEMA.CITRUS","KINEMA_CITRUS":"KINEMA.CITRUS","黒田洋介":"黑田洋介","新海誠":"新海诚","動画工房":"动画工房","BONSE":"BONES","A-1Pictures":"A-1.Pictures","A-1_Pictures":"A-1.Pictures","JC社":"J.C.STAFF","节操社":"J.C.STAFF","JCSTAFF":"J.C.STAFF","肉番":"肉","肉片":"肉","卖肉":"肉","肉感":"肉","肉感丰满":"肉","可疑的肉片":"肉","0":"0"};


(不限于动画,所有类型的条目)

TV:(TVA)
漫画改:(漫改,漫画改编)
轻小说改:(轻改,轻小说改编)
原创:(原创动画)
剧场版:(劇場版,劇場版アニメ)
京阿尼:(京都动画,京都,京都アニメーション)
动画工房:(動画工房)
Production.I.G:(ProductionI.G,Production.IG,Production_I.G,ProductionIG,I.G)
Production.IMS:(ProductionIMS)
TMS.Entertainment:(TMSEntertainment,TMS_Entertainment,トムス・エンタテインメント)
key:(key社)
A-1.Pictures:(A-1Pictures,A-1_Pictures)
BONES:(骨头社,BONSE)
Diomedéa:( Diomedea)
KINEMA.CITRUS:(KINEMACITRUS,KINEMA_CITRUS)
J.C.STAFF:(JC社、节操社、JCSTAFF)
SUNRISE:(日升)
GAINAX:(GANAIX)
东映:(東映アニメーション)
国产:(国产动画)
日本:(日本动画,日本漫画)
科幻:(SF)
治愈:(治愈系)
泡面番:(泡面)
宫崎骏:(宮崎駿,宫崎峻)
新海诚:(新海誠)
花泽香菜:(花澤香菜,香菜)
钉宫理惠:(钉宫,钉宫病)
冈田麿里:(冈田磨里)
奈须蘑菇:(奈须きのこ)
黑田洋介:(黒田洋介)
柯南:(名探偵コナン,名侦探柯南)
肉:(卖肉,肉番,肉片,肉感丰满,肉感,可疑的肉片)

漫画:(コミック,マンガ)
单行本:(コミックス)
成人漫画:(成年コミック)
BL漫画:(BLコミック)
少女漫:(少女漫画)
東方:(东方,東方project,东方project)
讲谈社:(講談社)
漫画单行本:(漫画単行本)
西尾维新:(西尾維新)

同人:(同人音乐,同人音樂)
泽野弘之:(澤野弘之)
梶浦由记:(梶浦由記)

欢迎大家补充
#2 - 2019-9-21 21:33
(いいんです)
有些标签有人标繁体字版本的(
#3 - 2019-9-21 21:52
漫画→コミック
单行本→コミックス
#3-1 - 2019-9-21 21:57
君寻
comics不是单行本吧
#3-2 - 2019-9-21 22:01
スラント
君寻 说: comics不是单行本吧
「コミックス」更多指的是单行本,和「連載」对应
コミックとは漫画というジャンル全体をさす。
コミックスは、漫画を単行本にしたもの。
サイズは172mm×112mmが基準で
それ以外のものはワイド判コミックスなど別の呼び方で言うことが多いです。
#3-3 - 2019-9-21 22:07
君寻
スラント 说: 「コミックス」更多指的是单行本,和「連載」对应
原来如此,感谢
#4 - 2019-9-21 21:53
#5 - 2019-9-21 21:54
(。´-д-)
消歧义不好弄..比如 奈须蘑菇 奈须きのこ 这种应该算一个标签的两个语言版本 而不应该认作同一个标签, 简体繁体字同理..而钉宫理惠与钉宫病又不完全等同, 同人与同人音乐也不完全相同..
#5-1 - 2019-9-21 22:01
君寻
统计标签时用的,同一个意思的都应该汇总为一个,钉宫病肯定有钉宫理惠,同人音乐在音乐统计的时候归类为同人没问题。
标签统计在不同类型条目的收藏页是分开的,所以像日本动画和日本漫画都可以归为日本没问题。
#5-2 - 2019-9-21 22:11
Cedar
君寻 说: 统计标签时用的,同一个意思的都应该汇总为一个,钉宫病肯定有钉宫理惠,同人音乐在音乐统计的时候归类为同人没问题。
标签统计在不同类型条目的收藏页是分开的,所以像日本动画和日本漫画都可以归为日本没问题。
喔..如果是给组件用来统计标签的话就没问题..
#5-3 - 2019-9-21 22:13
snylonue
君寻 说: 统计标签时用的,同一个意思的都应该汇总为一个,钉宫病肯定有钉宫理惠,同人音乐在音乐统计的时候归类为同人没问题。
标签统计在不同类型条目的收藏页是分开的,所以像日本动画和日本漫画都可以归为日本没问题。
那应该统一一下语言?比如都用简体字
#5-4 - 2019-9-21 22:39
君寻
snylonue 说: 那应该统一一下语言?比如都用简体字
嗯,本来想的是按标记数最多的为主,看了一下确实有点乱,那就都用简体中文吧(東方除外,車万不可弃)
#6 - 2019-9-21 22:35
(迷子でもいい、迷子でも進め。)
这个是不是稍微有点难度。比如几乎所有标签都有中日两种语言版本,根本枚举不过来(bgm38)
#6-1 - 2019-9-21 22:38
君寻
看标记的数量会不会给统计带来困扰,冷门标签可以忽略,动画标签标记数500以下,其他标签标记数100以下就可以忽略了
#7 - 2019-9-21 22:44
电影/     动画电影 剧场版 剧场 剧场用动画 动画剧场版  独立剧场版   『剧场版』  剧场版化   アニメ剧场     剧场版动画   剧场动画   
映画    映画(剧场版)     アニメ映画    アニメーション映画
劇場版  劇場版アニメ 劇場 アニメ劇場 アニメ劇場版

随便搜了些同类的,简直是百花齐放……其中还有很多是不能归到一起的,感觉想要合并……道阻且长……
#8 - 2019-9-21 22:48
(BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈 三位一体 ...)
又要爬数据了吗?
#9 - 2019-9-21 23:09
(星梨花/環/弥生/桃子/杏奈P)
deen studiodeen 丹尼动画
印象里应该有一众这种studioxxx和xxx并用的表情
#10 - 2019-9-23 15:07
(ACG猫舌,喜欢补已经凉了的企划,不喜欢趁热。)
好组件!最不喜欢同一个意思的标签重复出现几次。(bgm38)
首先肯定是各个会社和staff条目里自带的别名、化名等等。

ProductionIMS:Production.IMS、プロダクションアイムズ
#10-1 - 2019-9-23 15:11
君寻
感谢!
プロダクションアイムズ 的标记数只有65,太少了,忽略不计
#10-2 - 2019-9-23 15:18
751984871
君寻 说: 感谢!
プロダクションアイムズ 的标记数只有65,太少了,忽略不计
仓田英之:倉田英之
黑田洋介:黒田洋介
新海诚:新海誠
动画工房:動画工房
TMSEntertainment:TMS_Entertainment
A-1Pictures:A-1_Pictures
Diomedéa:Diomedea、diomedea_inc.、屌媒体
KINEMACITRUS:KINEMA_CITRUS、KINEMA.CITRUS
J.C.STAFF:JC社、节操社、JCSTAFF
青岛崇:あおしま たかし
笔安一幸:筆安一幸、ふでやすかずゆき
兽娘动物园:けものフレンズ 、动物朋友、动物好友
八百万:ヤオヨロズ、YAOYOROZU
卖肉:肉、肉番
日本:日番

化名之类的
木上益治:多田文雄、多田文男、三好一郎
新房昭之:南泽十八
天冲:天衝、田中基樹、田中基树

莫名其妙的错别字
BONES:BONSE

主要还是顺着http://bgm.tv/anime/tag往下拉了
#10-3 - 2019-9-23 16:04
君寻
751984871 说: 仓田英之:倉田英之
黑田洋介:黒田洋介
新海诚:新海誠
动画工房:動画工房
TMSEntertainment:TMS_Entertainment
A-1Pictures:A-1_Pictures
Di...
标记数比较多的都加了
卖肉、肉、肉番 这个我想一想怎么处理
#10-4 - 2019-10-2 09:42
751984871
君寻 说: 标记数比较多的都加了
卖肉、肉、肉番 这个我想一想怎么处理
网野哲郎:アミノテツロー
#11 - 2019-9-23 15:39
(ACG猫舌,喜欢补已经凉了的企划,不喜欢趁热。)
有的标签虽然加起来未过500,但是集中在单个条目里面影响极大。就是像这个条目的BONES:BONSE这种,一不小心很容易跟着标错
所以还是比较希望能加上……

上面说到的这个条目是进排行榜前1000而且vote有近两千人的作品。如果是冷门小作品还可以不管总量没过500的小标签。这种热度高一点的作品我还是希望所有进[常用标签]的重复标签(哪怕总量只有499个)都能被合并。
#11-1 - 2019-9-23 16:03
君寻
加了
#12 - 2019-9-23 15:42
(V1046-R MAHORO)
这叫同义词合并,消歧义的反义……

一个词有多个意思进行区分才叫消歧义
#12-1 - 2019-9-23 16:03
君寻
多谢指正
#13 - 2019-9-23 16:18
(ACG猫舌,喜欢补已经凉了的企划,不喜欢趁热。)
日本:日本动画
这个建议慎重考虑。因为有个叫“日本动画”的公司http://bgm.tv/person/791
#13-1 - 2019-9-23 16:25
君寻
我觉得没问题呢,因为标“日本动画”的99%都不是那个公司做的
#14 - 2019-9-24 01:02
(小圣杯毕业,回归动漫生活)
我提一个意见,可以把声优马甲的便签统一一下
#15 - 2019-10-2 09:56
GalGame
GALGAME
Galgame
galgame
这四个能不能合并一下
#16 - 2019-10-2 10:14