评分与排名讨论会 » 讨论
我觉得评分里影响最大的就是1分率了

#1 - 2021-12-27 20:30

narcissus

如果我可以得到一个去掉1分的排名榜单，我更愿意看那个。

当然，我不是说打1分的人可以忽略，因为他们表达不喜欢一部番剧，肯定也算是评分意见的一部分。但是问题就在于这部分人对排名影响的实际影响，已经远远超越了那批不喜欢番剧的人比例。

这也是一个比较现实的问题，不能简单的理想化。因为现实里一部动画的均分差不多在7，特别是高分动画，有时候甚至均分能达到8。这个时候打10分能提高的均分是很小的，打1分能降低的均分是极大的。不管是10分还是1分都只代表了一种强烈的情感取向。（甚至1分的情感取向更大，只有极少人是不考虑情感打1分）

如果说打分目的是本来就是让一小部分人情感取向获得很大权重，那这么设计是没问题的。问题是打分的设计绝大部分都是基于一个平均值算法，设计的时候想达到效果通过是1人1票外加10分到1分的细致区分，来让大家的每个分数有差不多的权重。只有在这一部分上格格不入（甚至高分和低分用两种完全不一样的算法），实际上这个1分严重影响了排名系统的一致性。

打1分的本人是没有任何问题的，因为任何人都有权利打分，但是你系统计算的时候是会出问题的。

如果打分是基于对比，那肯定会比平均分科学：比如看过动画a和b的人群每种100票对比，10分的a比b高10票，9分的a比b高10票，最终虽然1分的a比b高3票，但不至于因为这区区3票1分得出a在100人口碑上输给了b的结论。

#2 - 2021-12-27 20:59

invisible (毒性非常大，小孩看了会犯错误，会犯很大的错误 ...)

我现在觉得steam的评论和打分机制挺合理，
喜欢、不喜欢，当然，两分制不一定适合番。
展示时分语言、时间段，
如果某游戏近期因为大量非游戏本身因素被打差评，
很容易被看出来，
那么我根本无所谓，照买不误

#3 - 2021-12-27 21:01

雪の宿❄️

小乖的科学排名就是基于你说的对比呀 (bgm38)

#3-1 - 2021-12-30 14:17

思根叶

因为小号会被清掉，最后留下的一分都是打分很多的人，一分在他们的list里是最末，而他们的权重会比无脑十分的新人更高，所以那个排名应该是放大了平衡一分的权重，实际上你看排名变化掉的最多的就是最经常被diss容易被打恶意一分的那些作品。
只要用户不根据自己的观感而是出于让自己一个人左右多人的意见这种目的去打分，什么算法都救不了。

#3-2 - 2021-12-30 14:37

narcissus

思根叶说: 因为小号会被清掉，最后留下的一分都是打分很多的人，一分在他们的list里是最末，而他们的权重会比无脑十分的新人更高，所以那个排名应该是放大了平衡一分的权重，实际上你看排名变化掉的最多的就是最经常被di...

就是这个道理，我在下面回复过，这个排名和我的想法思想完全相反了。比如我也有好多年的账号好几百个评分，理论上讲我给打1分影响力会超过很多人了。我觉得这是不合理的，我要求是反应出平均的口碑而不是更加放大个别非刷分用户的权重。

#3-3 - 2021-12-30 15:00

思根叶

narcissus 说: 就是这个道理，我在下面回复过，这个排名和我的想法思想完全相反了。比如我也有好多年的账号好几百个评分，理论上讲我给打1分影响力会超过很多人了。我觉得这是不合理的，我要求是反应出平均的口碑而不是更加放大个...

其实我打完这段话后想了想可能也不一定，还是看具体算法，打分多的也不知道是不是真的权重高，我研究的不是很仔细。但可以基本确定的是，就算没有放大问题，这个算法也不大可能解决问题，因为永远不可能分辨一个1分究竟是真的反映了观感还是为了平衡。

#3-4 - 2021-12-30 17:32

雪の宿❄️

就科学排名而言，一个打分多的用户会在计算两部作品的相对分值时被参考的次数更多，但不会对排名产生直接影响（比起直接算平均分）。另外，一个用户的打分在任何合理的排名下都没法影响全局排名。

为避免误解，我简单说一下自己对科学排名的理解，科学排名的主要思想就是取任意两部作品A和B，在同时给A和B打分的人里面，统计是A>B的人多，还是B>A的人多，由此给AB赋予相对分值，最后再根据所有的两两相对分值做出排名。这就和主楼最后一段说的差不多呀。

更严格地讲，对任意两部作品A和B的相对分值，小乖是考虑了三种计算方式，然后融合到一起的。上述只说了倾向性概率这一种，另外两种是算术平均和几何平均，如果想要完全消除1分的影响，那不融合后两种就行。

#3-5 - 2021-12-30 22:52

narcissus

雪の宿❄️ 说: 就科学排名而言，一个打分多的用户会在计算两部作品的相对分值时被参考的次数更多，但不会对排名产生直接影响（比起直接算平均分）。另外，一个用户的打分在任何合理的排名下都没法影响全局排名。

为避免误解，我...

问题主要是出在a和b同时打分这里，很多只给单独作品打分的数据，会被忽略。这样的话打分多的人意见就会更重要，而那些打分少的人会被当成刷分忽略。

我说的对比不是同一批人，是整个分数的比例按照票数多少对比。

#3-6 - 2021-12-31 00:49

雪の宿❄️

narcissus 说: 问题主要是出在a和b同时打分这里，很多只给单独作品打分的数据，会被忽略。这样的话打分多的人意见就会更重要，而那些打分少的人会被当成刷分忽略。

我说的对比不是同一批人，是整个分数的比例按照票数多少对比...

那这就是价值层面的问题了，得不出答案。我认为只有同时看过两部作品的用户才有对这两者优劣的发言权，而排名就是这种相对优劣的观点的平均，不是两个独立的绝对分数集合的比较。

理由的话比如，绝对分数在不同的人眼中的意义会差很多，也容易变动，但相对优劣会更稳定。比如在看到了以前从未见过的神作之后，不仅会给它10分，而且会把以前看过的大多数作品的分数都下调1分，这种操作是不少见的。

就算按绝对分数来算，也是打分多的用户被参考次数多，只不过随着打分数是线性增长，而按相对分值计算的话是平方增长。

#3-7 - 2022-2-8 13:51

narcissus

雪の宿❄️ 说: 那这就是价值层面的问题了，得不出答案。我认为只有同时看过两部作品的用户才有对这两者优劣的发言权，而排名就是这种相对优劣的观点的平均，不是两个独立的绝对分数集合的比较。

理由的话比如，绝对分数在不同的...

这就是单纯的完全相反价值观问题，你的策略我完全懂。我的价值观是让一票就等于一票，不因为这票参考次数多或者是1分离开平均分更远而更重要。我反对1分也是类似的原因，不是因为你们想的不客观。

所以我才说科学排行榜和我说的南辕北辙，更加重了一票的权重。

你可能没注意到这里面强烈的筛选和偏见。因为一般来说能比较两种动画好坏的人，都是老宅，因为必须看过足够多的动画才有足够大可能有这种比较，看新番的人是很难有的。老宅那可是一个极端强的筛选了。
举个例子，你评价辣条是不是一种好吃的零食，但是必须吃过龙虾对比，不然会被筛掉。这实际变成了你统计富人们觉得辣条是不是一种好零食了。

而老宅的口味实际上和新宅不一样的，你可能会想把十年前的你打一顿，十年前的你也会想打你一顿。这不是优劣的问题而是取向不一样。十年前你最喜欢的那个新番有情怀，换成今天的你再看可能不会打高分，反而你会喜欢一些老宅口味的动画，然而这个你不喜欢的新番也是别人的十年后的白月光。

#4 - 2021-12-27 21:29

yuina (奇迹和魔法都是存在的)

私以为看评分的小数位没什么意义，可能就是被极端分影响了，但7分和8分的作品还是有本质区别的
不过最有意义的还是自己的评分，看别人的也意义不大

#5 - 2021-12-27 22:44

porepoem (班固米JK学家)

一个1分对于一个作品的影响确实大于一个10分，但是这对于所有作品都是一样的，所以我感觉对排名影响也还好吧

#5-1 - 2021-12-29 13:06

narcissus

你没看到举例吗，怎么可能对所有作品都一样呢。评分的设计目标是为了得出大概的平均口碑，但是一个作品明明平均口碑好于另一个，喜欢的人多于另一个，只需要极少数人打1分就可以比另一个低。

a作品95个人喜欢5人不喜欢；b作品80人喜欢20人不喜欢，只需要那不喜欢的5人打1分就可以均分输给b。而这5人可能完完全全是外部因素，比如看a分数太高了，b运气好没有人打。

#6 - 2021-12-27 23:00

冷猪 (好好的几把上怎么就长了个男人呢！)

正因如此，高分番才显得难能可贵。

就我个人而言，打过1分，打过5-6分及以上，但是很少打2-4分的。所以在统计时可以默认1分=3分/4分。这样可能相对来说更合理一点。

#6-1 - 2021-12-27 23:03

冷猪

翻了一下排名前10的动画，确实打2 3 4 分的人是最少的。加起来都不及打1分的人

#7 - 2021-12-27 23:55

老大 (你谁啊？我准许你套近乎了吗？)

去掉一个最低分，去掉一个最高分

#7-1 - 2021-12-29 13:00

narcissus

如果打分中位数是5你这做法才有合理性，而且如果打法中位数是5，那么去掉不去掉影响不大。而且任何作品都有人打1和10，你这等于直接去掉了1和10。还不如单单去掉1。

#7-2 - 2021-12-30 00:45

老大

narcissus 说: 如果打分中位数是5你这做法才有合理性，而且如果打法中位数是5，那么去掉不去掉影响不大。而且任何作品都有人打1和10，你这等于直接去掉了1和10。还不如单单去掉1。

我就好玩讲讲

刷10分比刷1分难

#8 - 2021-12-29 13:41

红炉点雪 (此账号已停用)

一分率相比附近作品明显偏高是大雷（场内或场外）预警，鉴于评分和排名对吃瓜群众的主要目的（追补番参考），还是蛮有存留意义的

同二楼推荐科学排名

#8-1 - 2021-12-29 14:04

narcissus

大雷预警只有看打分分布的人才有意义，本身对于平均分排名是破坏性的。

而且这东西除了让平均分明显低于实际口碑均值，除了让分数从8.5变成8.4也体现不出来预警，还是均分高于无雷的作品。除非那些看分数构成的，而你都看分数构成了，有额外的维度单独评价作品了，直接来一个争议榜就行了，更不能容忍额外维度对均分的不合理影响。

另外我看了这个思路，和我不太一样。这个也是基于排名对比，但是强调同一个用户，强调是不能刷分。而我则觉得刷分是很重要的参考，没有任何人规定看了a动画没看b动画就没发言权，而且不喜欢才会刷低分，喜欢才会刷高分。你给这去完了完全和我思路不一样。

我任何1分问题和10分问题不在于刷，而是1%的刷1分的，效果比5%刷10分的大。这实际上和平均这种计算综合口碑的方式背道而驰了。目前来说可能最好的方法是改变打分的方式，比如默认动画0分，喜欢加1分，再喜欢加2分，最高加到5分，同样最低扣到5分。这样的话就从根本上解决这问题了。

#9 - 2021-12-29 14:27

夷蹴而就 (当你长大，会成为绝望者、失败者与被诅咒者的拯救者吗？ ...)

1被批斗了，2是不是下一个？

#9-1 - 2021-12-29 19:39

narcissus

理论上一个意思呗，不过现实里一般都打1分。另外谁批斗1分了？

平均分系统的不合理并不是打1分的人不合理。我只是说如果能有去掉1分的均分数据，我个人更愿意相信那个。如果有办法可以按照人数比例口碑比例反应1分的方法，那肯定比简单粗暴去掉更合理。

#9-2 - 2021-12-31 07:27

第四人称

narcissus 说: 理论上一个意思呗，不过现实里一般都打1分。另外谁批斗1分了？

平均分系统的不合理并不是打1分的人不合理。我只是说如果能有去掉1分的均分数据，我个人更愿意相信那个。如果有办法可以按照人数比例口碑比例反...

你算平均分去掉1分不就等于在跟打1分的人说，你们打1分等于打了白打，然后这部分人以后看番不爽就打2分了，这样以后明日之2分不就是今日之1分

#9-3 - 2021-12-31 18:44

narcissus

第四吟游说: 你算平均分去掉1分不就等于在跟打1分的人说，你们打1分等于打了白打，然后这部分人以后看番不爽就打2分了，这样以后明日之2分不就是今日之1分

那不是挺好的吗，至少更接近实际比例。我就是想把这部分人带来的过大影响去掉啊。如果最终低分刷4高分刷10，综合来说离7都是3分，那就完全符合人数比例了。

总不可能让2个人打1分比10个人打10分影响力更大吧。如果现实里的话那肯定是10个人代表多数意见啊，只有均分里才会2个人代表多数意见。我看均分是为了看多数意见，不是为了特定谁（这里是打1分的人）的意见。

#10 - 2021-12-30 00:53

此间的少年x

去掉1分的排名我很久以前搞过，说老实话排行榜前几页跟正常比基本没啥区别

#11 - 2021-12-30 01:33

zod (睡眼朦胧)

分制的问题，bangumi十分制评分理论上很严谨，但是实际运行不知道为什么就变成了五分制，原本6分对应3星，实际变成了8分对应4星，7分对应3星，6分对应2星——1分对应1星

如果要平衡，除非改五分制

#11-1 - 2021-12-30 15:06

夷蹴而就

5分以下的评分标准太模糊了，就连社区给出的指导“较差”“差”“很差”也是语焉不详，能让人打低分的作品多少得让人带情绪，带情绪就会极端

#12 - 2021-12-30 03:14

飛龍 🇺🇸🇯🇵🇹🇼🇺🇦 (让我们远离冰冷的房间，亲自推动历史的进程。 ...)

1分恰恰是最容易发现和剔除的，相反 10 分反而更加隐蔽，因为喜欢的人肯定愿意多说话，给出十分的用户你很难看出他的异常之处。从人的角度去考虑，二次元的受众群体，他肯定是喜欢二次元才会注册一个二次元评分网站的账户，反过来说，如果二次元中有大量他非常讨厌的作品，他还会不会是个二次元观众呢？你要考虑到网站本身对特定用户的吸引。所以你觉得他是更加倾向于严苛还是宽容？

如果你将1和10视作数理统计的对象而非数值去看，其实是平等的。其实你不妨做个假设：如果把1分剔除，最低分变成2分，同时增加一个11分的选项，你猜会是什么结果？

#12-1 - 2021-12-30 13:56

narcissus

你的考虑是发现和剔除，关注的是刷分，而我其实没有太反对刷分。你关注的是打分的合理性，而我从来觉得任何人怎么打分都是合理的。

问题在于平均分应该如何解释，或者说平均分的设计目标是什么：那应该是打分人的平均口碑。这时候1分就会导致平均分偏移平均口碑，这问题不是打1分的人造成的，而是所有人的打分倾向造成的。

#12-2 - 2021-12-30 14:49

飛龍 🇺🇸🇯🇵🇹🇼🇺🇦

narcissus 说: 你的考虑是发现和剔除，关注的是刷分，而我其实没有太反对刷分。你关注的是打分的合理性，而我从来觉得任何人怎么打分都是合理的。

问题在于平均分应该如何解释，或者说平均分的设计目标是什么：那应该是打分人的...

如果你真的【从来觉得任何人怎么打分都是合理的】，那就不会有这个帖了。比起挖空心思去解释数据，你不觉得改变设计去控制下人更有效吗？

#13 - 2021-12-30 08:29

juniorant

https://bgm.tv/group/topic/360689
以前有人做过高分动画去掉1分的统计，整体影响不大

#14 - 2021-12-30 14:32

A.one (https://bgm.tv/subject/467354)

可能是几个样本人数太少了吧而且条目分数和排行不是直接算平均分的吧和投票人数也有关

投票人数很少的统计结果本身有没有参考意义就是个问题

#15 - 2022-2-8 14:16

[已封禁]

MARK，闲下来好好拜读一下

/ 返回评分与排名讨论会小组

评分与排名讨论会 » 讨论我觉得评分里影响最大的就是1分率了

评分与排名讨论会 » 讨论
我觉得评分里影响最大的就是1分率了