juniorant 说: 你说的很有道理。 我2楼的回复实际上是看了很多评分网站的结果,当然确实这是“主观性”的判断。 我提及“无续作加成”的网站的一些rank是这样的: 攻壳机动队 STAND ALONE COMPLEX>攻...
秘则为花 说: 是的,反例可以找到很多。实际上,到现在都没人统计过,bgm所有续作中,究竟是评分高过前作的多,还是低于前作的多 并且,就常识而言,如果前作可以取得成功,那么制作方应该会乐于投入更多资源,制作更优良的...
银毛熊 说: 问题是提纯导致的打分评委不同已经使得续作跟前作之间的分数对比毫无参考价值了,我本身对bgm分数的看法就是能反应大众风评但未必能反应客观质量,其实能发挥反应风评的价值就已经非常好了。但是“反应风评”这项...
juniorant 说: re0其实有点特殊,因为当时16年的风评可比现在差多了,之后几年来异世界作品普遍糟糕,re0风评逐渐回升。但最初给re0差评的人可能就没回来改分了。 拿受风评影响更明显的s1来说,re0第一季只有4....
银毛熊 说: 其实能有续作效应和不能有效应的系列大部分都可以预判,连番都不用看的,续作staff出来猜一下就能八九成命中率了,证明这里有规律可循的,既然有规律可循,我认为通过算法是可能一定程度消解掉的
隔壁的王某某 说: 只是认为讨论这种效应最初的目的就不纯,感觉之后的争论就很是可笑了。算法是要考虑整体的,只盯着前排那些有“续作效应”的动画那就应该单列一个榜单,而不应该对网站整体参考性产生质疑。
银毛熊 说: 如果真心要解决那肯定不只是续作水分会挤掉一些,好的复杂算法还能把打分平台的类型偏好等问题导致的排名虚高虚低也一定程度修正,不是针对续作
隔壁的王某某 说: 你说的对,讨论算法的前提就应该从整体出发。但要一下子解决你说的那些问题也是很难的,现在国内做的比较好的也就科学榜了。
银毛熊 说: 科排单从排名角度我觉得已经挑不出啥毛病了,真正解决了打分评委本身就不同而虚空对比的排名痛点。只不过也因为原则上是通过作品两两间比较算出来的,重在相对硬核的“比”无法再二次转化为更直观的分数,实用性上难...
ξ゚⊿゚)ξ讀者諸孃へ御願申候 说: 科学排名的思想是正确的,但仍然还是有主观的地方,比如说他的选取的两两比较方法以及相应的加权方式就是人为的,并且这种特定的比较方法的选择导致评分高度偏向小众婆罗门作品。当然我不是说偏向婆罗门作品就不对,...
银毛熊 说: 你这个榜单我第一时间是感觉对评分人数多的条目出奇友好,前阵子君寻给的这个目录前列的在这种算法下容易拿到前排,不过没有查询功能去一个个细看系列走势不知道对扼制续作效应和修正类型偏好的效果具体如何。纯猜一...
ξ゚⊿゚)ξ讀者諸孃へ御願申候 说: 关于热门条目的问题,我测试时把开始统计的门槛设成了只有共同评分人数大于等于10才纳入统计。这个门槛是我事前拍脑袋定的,后来发现相对于bgm的评分数来说这个标准还是太高了。但如果把这个门槛去掉,可以看那...
银毛熊 说: “只要有一个人认为甲作品比乙作品好,科学排名对甲作品的评价就要稍高一点”,重在“比”的榜单我觉得这个排名逻辑本身没问题,问题是数据太少而已,但就算只有一个也比完全没有要好
ξ゚⊿゚)ξ讀者諸孃へ御願申候 说: 当然你可以这样认为,但这个地方必然是有主观性的。比如1个人认为甲比乙好,100个人认为丙比乙好,那是不是丙比乙好的程度就是乙比甲好的程度的100倍?并没有这样的理由。那如果要度量这个规模差异就要赋权重...
s1psw 说: 这也是个问题,所以这帖子是仅作为“假设”,如果能那怎么缓解
s1psw 说: 续作确实会不可避免的产生争端,近期制作越来越好也是原因之一,会导致部分前作和续作间隔开好高的差距。怎么莫名感觉以后会越来越多,争论也越来越激烈
Total Percentage Simple 20.72 0.2437 0.4316 点兔一期 30.32 0.2980 0.4912 点兔二期 11.58 0.1871 0.3240 点兔三期
ξ゚⊿゚)ξ讀者諸孃へ御願申候 说: 按照我测试的排名方案(https://bgm.tv/group/topic/371075),点兔二期最佳,一期次之,三期最差。 Total  ...
s1psw 说: 治标不治本赞同,看来是个挺有趣的人,加了
Nightwing 说: 对本与标的区分同样可以运用到单集评分上面,不烂尾的动画显著地比烂尾的动画评分要高的多
Total Percentage Simple 68.79 0.5261 0.7421 ちはやふる 歌牌情缘 63.65 0.5282 0.7167 ちはやふる2 歌牌情缘2 11.26 0.2367 0.4165 ちはやふる3 歌牌情缘3
ξ゚⊿゚)ξ讀者諸孃へ御願申候 说: 所以说赶紧搞能按照条目查询具体用户打分的API,很多排名算法方面的YY都等着这个API来实现,不然就只能费力硬爬
我2楼的回复实际上是看了很多评分网站的结果,当然确实这是“主观性”的判断。
我提及“无续作加成”的网站的一些rank是这样的:
攻壳机动队 STAND ALONE COMPLEX>攻壳机动队 S.A.C. 2nd GIG
棒球大联盟全系列第一季最高
蜂蜜与四叶草>蜂蜜与四叶草II
虫师>虫师 续章 第2期>虫师 续章
银魂全系列第一季最高
寒蝉鸣泣之时>寒蝉鸣泣之时 解
轻音少女>轻音少女 第二季>轻音少女 剧场版
爆漫王。>爆漫王。3>爆漫王。2
歌牌情缘>歌牌情缘2>歌牌情缘3
昭和元禄落语心中>昭和元禄落语心中 -助六再临篇-
Re:从零开始的异世界生活>Re:从零开始的异世界生活 第二季>Re:从零开始的异世界生活 第二季 后半部分
灵能百分百>灵能百分百 第二季
无职转生 ~在异世界认真地活下去~>无职转生 ~在异世界认真地活下去~ 第二部分
此网站rank和bgm一样是简单的贝叶斯人数加权,没有用到其他算法,虽然续作评分用户的留存率比bgm低但用户加权人数也更少(只有21),我可以推算“该网站用户续作打分比较严苛”。
当然“续作假说”讨论的如此激烈其实最大原因还是基于很多用户觉得近年来的部分续作条目比自己心目中想的高,再扩展开来其实是很多用户觉得近年作品分数偏高而输出不满情绪。
并且,就常识而言,如果前作可以取得成功,那么制作方应该会乐于投入更多资源,制作更优良的续作。所以,这种“强者越强”的现象是可以解释的,并不一定需要引入未证实的观众偏好
举个典型例子就是re0,二季在各个ACG论坛包括bgm单集讨论可以感觉到风评逐渐走低的系列,真随机抽两千个都看过的网友基本就是1>2的,结果二期分数居然还能比一高,不说质量对比就是风评都无法正确反应了
拿受风评影响更明显的s1来说,re0第一季只有4.9(-4),第二季和第二季后半则是7.75(+110)和7.9(+116)。
而且还真不是啥re0情况太特殊导致的,它只是够典型而已。包括轻音少女和摇曳露营,只闻二不如一不闻一不如二,然而均分又是被续作杀。
也就是说不改算法的情况下,如今看到bgm续作分比前作高,说明不了续作质量更高不打紧,连续作风评更好都无法反应了。
再补充一点,并不是说续作降分了就意味着没发生“续作效应”,更可能是原本该掉近1分的续作因为吃了buff对比后才掉了0.5左右。同性质续作分不如前作的,必拉无疑,反过来却不成立
实际我前几天也是根据共同评分群体两两比较的方法测试了一下改用其他更简单的比较方法,更加强调得分的直观可诠释性,得到的结果就和科学排名很不相同:
https://bgm.tv/group/topic/371075
科榜在一定程度起到以上两种效果的同时我没感觉到热门作有任何加成,至于你说科榜太婆了的问题,具体是哪项加权方式导致的?
链接: https://pan.baidu.com/s/11j6Znfpbg2upRswBKEx-Eg 提取码: hpxp
关于科学排名,我没有看到关于科学排名用到的每项评分的算法介绍。但从公开简介上来看,是没有设共同评分人数的最低门槛的,这就导致了只要有一个人认为甲作品比乙作品好,科学排名对甲作品的评价就要稍高一点。当然后来科学排名的某些评分法里也依据共同评分群体的规模做了加权,但如果加权时对规模的权重设得不够高,最后还是会形成婆罗门狂欢的局面。
很多yuri类,没世界观,没剧情,没美术设计,没分镜,什么都没,我现在yuri类原则上全弃,我不知道这种作品有哪点可看. 还大片的人打七分八分