#1 - 2016-2-6 19:11
Genius🌟小乖💯 (Enjoy your (real) life!)
2021 年 10 月 31 日更新:
随着 chii.ai 的发布,ranking.ikely.me 即将成为历史。某科学的动画排名已经迁入 https://chii.ai,欢迎大家访问新站。
===============================
亲爱的 Bangumi users:
我们知道,长久以来,动画排名都是 Bangumi 的一个核心议题。追求公正的 Bangumi 动画排名是每一个 Bangumi 用户的共同愿景。今天,我很高兴地向各位宣布,现在有了一种更为科学的动画排名方案,这使得我们离理想排名又接近了一小步。
从去年十一月,我一直在研究排名问题,主要看的一本书是《谁排第一?关于评价和排序的科学》。我对里面的算法非常着迷。这本书所描述的排名算法,已经远远超出了基于平均分或加权排名所讨论的层次。当时我就决定要用里面描述的算法为 Bangumi 动画重新排名。
进入寒假以来,我一直都在 B 站直播写代码,写代码的内容就是 rankit,它是这本书里面所有算法的集合(目前只能说大部分)。在两个星期的孤独的直播之后,我终于完成了这一基于新算法的 Bangumi 动画排名。
戳我
关于这一算法的原理,我已经写了一篇 blog。我建议无论是懂还是不懂的都可以过来看看。
I feel sorry, what I've done is really trivial. Thank you for your concern.
随着 chii.ai 的发布,ranking.ikely.me 即将成为历史。某科学的动画排名已经迁入 https://chii.ai,欢迎大家访问新站。
===============================
亲爱的 Bangumi users:
我们知道,长久以来,动画排名都是 Bangumi 的一个核心议题。追求公正的 Bangumi 动画排名是每一个 Bangumi 用户的共同愿景。今天,我很高兴地向各位宣布,现在有了一种更为科学的动画排名方案,这使得我们离理想排名又接近了一小步。
从去年十一月,我一直在研究排名问题,主要看的一本书是《谁排第一?关于评价和排序的科学》。我对里面的算法非常着迷。这本书所描述的排名算法,已经远远超出了基于平均分或加权排名所讨论的层次。当时我就决定要用里面描述的算法为 Bangumi 动画重新排名。
进入寒假以来,我一直都在 B 站直播写代码,写代码的内容就是 rankit,它是这本书里面所有算法的集合(目前只能说大部分)。在两个星期的孤独的直播之后,我终于完成了这一基于新算法的 Bangumi 动画排名。
戳我
关于这一算法的原理,我已经写了一篇 blog。我建议无论是懂还是不懂的都可以过来看看。
I feel sorry, what I've done is really trivial. Thank you for your concern.
虽不能至,心向往之
1. “从这张图我们可以看到,使用 Borda Count 后的综合排名与各大排名的 Kenall Measure 都比 Bangumi 原始平均分排名表现要好,这充分说明了我们排名的科学性。”
——由图中可以看到你使用的24种排名中存在和bangumi排名同样程度的非相似度的算法,如ariavg_markov_xxx 等。你的这张图无法支持你的推断,只能说你选用的8种算法中的某些和(另一些&bangumi算法)存在着“应用方向上的区分”[or something]。看上去这个比例是5:4(包括bangumi标准在内),而merge是一个5:3的结果,与bangumi评分有差距可以预期。你无法凭此说明你的结果优于bangumi评分。
2. 当然上面是一些学术方面的质疑,提出原因是博客文章学术风格太浓了。。。。就个人而言我非常支持在这方面的工作,看上去算法还能进一步改进,祝LZ好运。
实际上应该多搞些尽可能独立的排名出来,基于线性代数的计算机排名只是一种计算机排名方式而已,还有基于模拟和统计学的排名,然后一起merge。
每个算法都有一定的适用范围的话,你单从给出的一张表上无法说明是否bangumi排名算法是其所考虑问题的最适算法。
其实是没有的,所以我的假设就是线性无关,用通俗的话说就是排名独立:我假设所有的排名都尽量从不同的出发点考虑,然后融合之。这个假设成立的话,我的排名与各个排名的距离,与 Bangumi 排名与各个排名的距离都更为接近。
Merge 这个行为就是在总体上降低风险,只要算法是正确而且有合理物理意义解释的,就不会增加风险。
一般而言平均解与每个解的距离总倾向于小于单项解之间的距离,所以你认为你所得的即是更优的?
——这里有一个问题,就是即使我不使用你的那8种算法,而用我拍脑袋自己编的随便8种奇怪算法,我也会得到类似的结果。我甚至不需要保证使用的算法是否数学或者物理合理。
因而我认为你的逻辑建立在一个实际上和排名算法本身没什么关系的数学性质上,你无法凭他们“距离更近”说明这个所谓的“平均结果”是否真的比bangumi评分更优。
再明确一下,我的意思是,或许你做的是正确的,但是你需要更加有说服力的论证手段来证明你的观点。现在你的论证是有缺陷的。
我想起来了一个势函数,这个势函数与当前所有的算法都无关,但是它能够衡量一个既定排名与所有用户评分纪录的相符程度。这个可以看作一个独立于算法的评价标准,用这个是最好的。
嘿嘿~喵呜~
毕竟看到有人在干活我才能定下心认真看书
我的意思是那种送一个GET请求, 返回一个JSON的那种公用的API
试着请求 id=326, 却返回了"rank": 326
而, 如 #48 写的, 我希望拿到的是 "id": 326
该算法每部番之间的排名是互相影响的,排名不再孤立地被计算,而是比较每两部番之间的好坏得出在全体番组之间的最佳位置。