评分与排名讨论会 » 讨论
有哪些适合小样本的排名算法？

#1 - 2017-12-25 15:25

君寻 (已淡出bgm38)

样本数约为 0~100
平均值约为 40

简单Multiple （v*r/C）
严重缺点是没有区分低分与高分的众数效应，如3分 100人评分与 10分 30人评分算下来是等价的，这种算法显然不可用。

贝叶斯平均
典型的就是IMDB排名算法（(v/(v+m))*R + (m/(v+m))*C））
缺点是在R=C时没有区分度，如果平均分较高，整个区间会比较窄

Wilson区间法
基本思想：
第一步，计算每个项目的"好评率"（这里可以将评分化为（0-1）区间）
第二步，计算每个"好评率"的置信区间（以95%的概率）
第三步，根据置信区间的下限值，进行排名。值越大，排名就越高
Edwin Bidwell Wilson 修正公式：

p 表示样本的"好评率"，n表示样本的大小，z(1-α/2)表示对应某个置信水平α的z统计量，一般情况下，在95%的置信水平下，z统计量的值为1.96。
这个算法虽然保证了排名的可信性，但也带来了另一个问题：排行榜前列总是那些票数最多的项目，新项目或者冷门的项目，很难有出头机会，排名可能会长期靠后。

#2 - 2017-12-26 08:18

dhzy

马一个

#3 - 2017-12-26 10:10

lhb5883-吹冈王♛⑩ (BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈三位一体 ...)

我记得有一个相对排名算法，站里面有人实现过，首先假设没有人刷分，然后比较同一个人对某两部番的评分，打分高的算一票，统计所有对这两部番都打过分的人，这样就可以得出两部番的先后次序，依次类推，就可以给所有番排序了，我觉得这个算法相对合理。

#3-1 - 2017-12-26 10:22

Genius🌟小乖💯

I did not assume "没有人刷分". Infact, this method counteracts certain 刷分 scenario.

#3-2 - 2017-12-26 10:59

lhb5883-吹冈王♛⑩

低端小乖说: I did not assume "没有人刷分". Infact, this method counteracts certain 刷分 scenario.

这个算法只能消除一击脱离党，对于扭曲厨来说，还是可以刷的，IMDB那么复杂的机制，刷分党仍然可以为所欲为 (bgm38)

。
所以只要有机制存在，就有刷的可能。完全只是成本和收益的考虑而已所以卖握手券才是终极投票手段啊

#3-3 - 2021-12-23 06:07

ζ*'ヮ')ζ 讀者諸孃へ

我最近也在想这种排名法来着，优点不光是可以消除一击脱离党，也可以消除不同人打分尺度不同的影响。不过这种算法会导致可能出现A优于B，B优于C，C又优于A的循环结果，最后还是要统计一下被一部作品胜过的作品的总数，以此作为总排行的依据。

#3-4 - 2021-12-23 09:23

lhb5883-吹冈王♛⑩

ξﾟ⊿ﾟ)ξ読者諸嬢へ御願申候说: 我最近也在想这种排名法来着，优点不光是可以消除一击脱离党，也可以消除不同人打分尺度不同的影响。不过这种算法会导致可能出现A优于B，B优于C，C又优于A的循环结果，最后还是要统计一下被一部作品胜过的作品...

这个倒是有可能，尤其是比较焦灼的情况下

#3-5 - 2021-12-23 13:41

Michen

这个思路很可以

#4 - 2021-1-20 00:36

Jerry@Bangumi (我长大了要发明7G)

Mark

/ 返回评分与排名讨论会小组

评分与排名讨论会 » 讨论有哪些适合小样本的排名算法？

评分与排名讨论会 » 讨论
有哪些适合小样本的排名算法？