#1 - 2018-4-4 13:12
(班固米好像已经把同步率的计算取消了?)

今天我刚收集了一批作品评分的最新数据,想再来试一试能不能算一个合理的人与人的同步率。那么,排行榜相关性的通用指标:Kendall's τ-b,看上去很好。

但实际结果是,相关性0.8、0.9的跟我的共同评分作品只有十几个,进他们的主页一看基本都是全站标准排序。跟我共同评分作品20个以上几十个的,相关性就在0.7以下了。这样来看,以共同爱好或者排序相关性生成的同步率基本上都被全站标准排序的背景抹掉了有意义的用处。

平时我会去查看作品评分下面的“好友评价”。令我满意的是,我的“好友评价”相对全站平均分的偏差基本上都在我所希望的方向。(虽然我并不知道我的好友是因为什么原因加上我的?)分数的偏差是偏好,同步率在其实是小众、分门类的偏好上的同步。然而也不是所有作品都会去查看这个情况说明,这里作品与作品之间除了分数还是有一些隐藏的心理权值。

就这点评分难道真的能挖掘出够强的心理画像?我感觉这方面的数据挖掘是徒劳的。评分再多可能也不如写一篇评论的经验信息量丰富。
#2 - 2018-4-4 15:25
(BGMのTrinitas<=>婊冈妈<=>补冈妈<=>拜冈妈 三位一体 ...)
还要考虑打分高低吧?
#3 - 2018-4-4 15:51
(已淡出bgm38)
我是用彼此评分差的平方均值来判断对方的偏好是不是与自己相似
#4 - 2018-4-4 15:53
(Anime is a gag, and so are its dilettantes.)
可以往好了想想,说不定你挖掘的没问题,这个挖掘也有意义,只是没人跟你同步率高。
可以试着找找存不存在共同评分作品数量50以上,而且同步率在0.8以上的两个用户,存在的话这个发现对于这两个用户有没有意义。
#5 - 2018-4-8 01:20
说明你的评分方式很接近bgm的大众审美啊,这不是坏事(?)

看情况吧,单纯考虑逆序数也行,考虑评分差的方均根也行,反正是规定化的两个特例,今天喜欢取各种奇奇怪怪的规定化映像我觉得也还行,毕竟这类评分本来就受到用户的”打分策略“影响,而并不是所有人都有相同的”打分策略“,所以这类量化很难去衡量绝对意义。

总之自己觉得适合就不算差。

顺带一提,我觉得Kendall's tau coefficient有0.5已经不错了?对于n部作品(当然这个n不能太小),这意味着以一个人为参考基础,另一个人的逆序数仅有n(n-1)/4,或是说存在一个排序方式,两个人与其相比的逆序数均不超过n^2/8(非严格上界,应该还可以再压一点)
#6 - 2018-4-8 03:36
(你谁啊?我准许你套近乎了吗?)
你居然能找到相关性和你那么高的人
#7 - 2018-4-8 10:16
并不是每个人都能写评论(bgm38)