#1 - 2012-2-21 02:00
林卯 (✨️VIP 8✨️)
如题。我怀疑按照这个系统,小粉红会累坏的,所以没提,不过今日不吐不快…
这方法主要是方便用户但不方便网站。另外是“主观合理”。
①用户[某]新来bgm.tv,看了1个动画A,此时评分是——不能评分;
②但又看1个动画B,发现可以评分了,但,是选择相对于A高还是低还是无法判断(即平齐);
UI上是这样:☑>A≈☐>☐
[某]选了高(B>A)
③又看1个动画C,选项是这样☑>B≈☐>A≈☐>☐
[某]选了高于B(C>B>A)
这样,高低完全是主观判断,不用思考打多少分。
④如此继续,看了9个动画后,☐>I≈☐>C≈D≈E≈G≈H≈☐>B≈F≈☐>A≈☐>☐
4个分组已经出现,用户可以给分组自行命名,比如I神,CDEGH良,BF差,A雷——但这个分组理论上是无级的,CDEGH也可以继续分下去…
而且每个动画也可以凭主观重新选择分组。随时的。
【以上是用户看到的,以下是后台】
总分最高10,最低0,但最高最低都是达不到的,因为算法是这样:
①A=10/2=5
②B=10*2/3≈6.7,A=10/3≈3.3
③C=10*3/4=7.5,B=10*2/4=5,A=10/4=2.5
④……好吧这个算起来稍微有一点点麻烦:
I=10*9/10=9,([某]主观中的)真·神作
C=D=E=G=H=(10*8/10+…+10*4/10)/5=6
B=F=(10*3/10+10*2/10)/2=2.5
A=10/10=1
可以发现分数是按照主观浮动的。网站依此积分。
可以想见,如果有人是评ABCDEFGHI(超神作)>J(神作)>K(良),这个"超神作"实际在后台贬值很厉害。
问题是这样算法好像 真·超神作 不可能出现?除非开放最高11…
我感觉这个系统很简单,说不定有人也提过,所以,如有雷同纯属巧合。
【从回帖里获得的灵感】
bgm.tv当前系统可以这样过渡到此系统:
这方法主要是方便用户但不方便网站。另外是“主观合理”。
①用户[某]新来bgm.tv,看了1个动画A,此时评分是——不能评分;
②但又看1个动画B,发现可以评分了,但,是选择相对于A高还是低还是无法判断(即平齐);
UI上是这样:☑>A≈☐>☐
[某]选了高(B>A)
③又看1个动画C,选项是这样☑>B≈☐>A≈☐>☐
[某]选了高于B(C>B>A)
这样,高低完全是主观判断,不用思考打多少分。
④如此继续,看了9个动画后,☐>I≈☐>C≈D≈E≈G≈H≈☐>B≈F≈☐>A≈☐>☐
4个分组已经出现,用户可以给分组自行命名,比如I神,CDEGH良,BF差,A雷——但这个分组理论上是无级的,CDEGH也可以继续分下去…
而且每个动画也可以凭主观重新选择分组。随时的。
【以上是用户看到的,以下是后台】
总分最高10,最低0,但最高最低都是达不到的,因为算法是这样:
①A=10/2=5
②B=10*2/3≈6.7,A=10/3≈3.3
③C=10*3/4=7.5,B=10*2/4=5,A=10/4=2.5
④……好吧这个算起来稍微有一点点麻烦:
I=10*9/10=9,([某]主观中的)真·神作
C=D=E=G=H=(10*8/10+…+10*4/10)/5=6
B=F=(10*3/10+10*2/10)/2=2.5
A=10/10=1
可以发现分数是按照主观浮动的。网站依此积分。
可以想见,如果有人是评ABCDEFGHI(超神作)>J(神作)>K(良),这个"超神作"实际在后台贬值很厉害。
问题是这样算法好像 真·超神作 不可能出现?除非开放最高11…
我感觉这个系统很简单,说不定有人也提过,所以,如有雷同纯属巧合。
【从回帖里获得的灵感】
bgm.tv当前系统可以这样过渡到此系统:
……假设你看了多部作品后心血来潮分了十组,每一组名字叫1星2星3星……这不是和当前一样吗。当前怎么分,在首楼系统中还是怎么分。
不过,这个系统是给用户使用的,后台分数已经无所谓了。
至于“根本没有一个统一的标准”、“给出的分值和个人阅片量而不是片子质量挂钩,对作品不公平”,
我突然想知道“根本上有一个统一的标准”、“给出的分值和片子质量挂钩“的评分系统是什么样子——因为我们都知道,对于一个这样的网站,恰恰 统一的标准唯有大量人的主观判断,作品质量唯有大量人的主观判断。显然不会是找专家过来评判动画的标准和质量吧。
关于”个人的平均分都是5分,评分过程相当于是零和“——你是根据算法的哪点看出来的……
多种评分方式很正常啦,以上只是直觉上的第一想法,其实我倒很想找个大样本试试看,你所谓的是不是真的公平。【话说什么叫公平啊
某部作品能从别的作品那里剥削,说明在用户心目中是这样呀。首楼的A如果[某]不以为雷,那不至于垫底…
至于剥削分数的问题,在评分者心里未必会认同。直接的就会有 #18 的问题。好的作品以上是更好的作品,而不是说更好的作品出现后原来的变渣了。
算了,我标题标题不应该写评分系统(因为用户不评分),是评价系统。
打分这种东西,露露修就是10分我也不会认为它是神作,白虎排不进榜单我还是认为那是一部很不错的作品==
题外话,橘子和烂苹果倒是可以比较。
刚才我说“治愈系的虫师”。好了,虫师到底应该算治愈系还是算内涵系?
“不同种类的作品没有可比性”——
1.这绝对不成立的。动画可,电影可,书籍可。水浒传和封神榜,不同种类,为何前者排进四大名著而后者没…为何不同种类的西游记和红楼梦都能排进四大名著…
2.假如这条成立,那你怎样打分的?在打分的同时就是在把动画排序到十组里。
2.我怎样打分的?我的标准不是10分制w,BANGUMI这边的评分是妥协的结果。
请参见我的博客
在不能证明虫师和幸运星体裁不同的情况下,是类比不当,不妨换个例子。
#15-6的意思似乎没有被理解。动画中很多是难以分类或者具有多重标签的作品,如何处理它们?
实际上当前bgm.tv的评分就相当于强制每个人只能分十组高低,是了。(代入此系统的话,假设有人刚看完石头门的时候打九分,就相当于放到第2组,多年后他如果会迷惑当时为何放到第2组,同样也会迷惑为什么当时打九分:问题是相通的……)
此外对比是可以排除早期的。假设有人看20部忘10部,看30部忘20部,这个倒数1部的对比自然是用他还记得的倒数10部来排。
让我想想,
你的意思是否可以用添加一个“历史排行榜”功能,或一个“锁定当前排行次序”功能解决?
你提出的新想法确实很有意思,但是我没有感到比量化打分的方式更可靠和方便
——等等,若用户B真的看9部番组全是优秀,是他手气好还是有预知能力……
如果用户B是存心故意的话,那么他在当前 bgm.tv 故意全打1分是否更容易些?
所以这个方法能用的前提是大家的观片习惯是基本一致的才行
只需要一个赞
多好用
最让我怀疑的就是这个分散和均匀的结果了。
确实没什么多大的简化
另外不明白“光两个几个动画互相比较都觉得累”——你是怎样评分的。评分高差已经是在比较了。
难道还要作品去互相比较 搞笑动画跟剧情动画也能互相比较 这样比较有意义么?
2.意义如何不一样。
你说的那个人是谁?我不认识。你说的精确评分是什么?我不知道。
这个问题存在,但和此系统无关。
某人把他认为巨雷的片打1分,另一人也看这片认为还行,但他历史上打过最低分就是“还行”→这两人主观上统一但分数却不统一。
某人把他认为巨雷的片排最底,另一人也看这片认为还行,但他最底一行就是“还行”→这两人主观上统一了;
1分是主观的,对1分的描述也是主观的,这世间就没有一把客观的尺子。
老漫迷A只看“宫崎骏全集”,EVA,Fate之类等级的动画,然后艰难地给这些动画排序了,几乎没有约等于,里面EVA(纯举例)一不小心是30部里最后一个,那么EVA的在这个老漫迷这里的得分就非常非常低了
新漫迷B看所有新番,追三话以后狂弃一堆(但也还是给出评价,往往是靠后的负面的),那么可能一般优秀的作品就能拿很高的分数,然后某天B看了EVA顿时惊为天人果断排第一个
A和B打分都认真负责,但对同一个片的结果截然相反,这显然不甚公平
换句话说,LZ有可能假设了『所有人选片子都在所有片子中随机地选取,且无论片子质量如何都会给予打分』没有考虑到不同人选片子的方式和范围差异巨大,而且对烂片子“不予置评”完全不打分的人相信也大有人在
我觉得这会造成混乱。不利于用户之间的交流。
我去看他的列表,看到最低分是一部我认为中等的作品。
去问他,这部作品我觉得还行啊,他说,我也觉得还行啊,但是我的分级最低就是还行我从没看过觉得很差的作品呢。
那么,当前bgm.tv的10分系统是否考虑到“不同人选片子的方式和范围差异巨大,而且对烂片不予置评的人相信也大有人在”;
又,考虑到“不同人选片子的方式和范围差异巨大,而且对烂片不予置评的人相信也大有人在”的系统是什么样,是否适合bgm.tv的用户(或网站)。
最后,由于我已经声明是主观评价系统,对同一片评价结果截然相反 这种个别情况允许存在,甚至网站可以不设评分,所以我选择不考虑。网站需要评分,可以自行加权,换个算法的事。
②B=10*2/3≈6.7,A=10/3≈3.3
比如按照这个公式。我最开始标记的片是EVA和CLANNAD
我认为这两部都是超神作。EVA>CLANNAD吧。一个10 一个9
在你的系统下就变成一个6.7一个3.3了。如果我继续标记动画那还好。EVA和CLANNAD后面会有很多动画垫底,评分会趋于9分。如果我是一个僵尸用户,标记了两个动画后犯懒,不想标记了。那就悲剧了。CLANNAD就变成很雷的片了。据我所知这种用户特别多,懒得认真打分和标记的。
所以。还是只能是适用于很少一部分人的规则。扩大了绝对会悲剧。
那怎么行
不过当我看到许多寻求0.5分时忍不住笑了(相当于10分制扩展到20分制)
看到这个才明白...
但奇妙的是,在我隔壁帖有人强烈批评不应限制不同人主观差异哪怕一丝一毫,但在这里却批评由于追求表达不同人主观差异,评分无法限制到一致,于是没法可想了。
看起来我两贴引出了bgm.tv两个党派似的
"所有人综合评分应该达到一种公正客观的地步,利于比较和参考。"
本身就是两种思考方法,算不上党派吧…而且实际上也并不矛盾。
同时达成两个目的就是相当理想的评分系统了吧
比如说设想一下,明天文革又要开始了。现在你是中宣部长,最高领袖给你两部作品,比如说前边某层提到的《虫师》和《幸运星》,然后要求你从两部作品中选一部,作为反动作品的样板,批到批臭,从此以后谁也不许再看、再讨论,包括你也不准再看了,否则一律枪毙。另一部作品则作为进步作品的样板,要求全国集体观看学习、纳入中小学课本。最高领袖的指示,你作为中宣部长不得不照办,否则你靠边站,换别人上来继续干同样的事。这时候,你会怎样选择呢?
我觉得如果我在这种情况下随便给我两种什么作品都能比较出来究竟更喜欢哪一种来……
不过在另一条bangumi实行排序评分制的时间线上,我大概到现在还是在不懈追求着完美的可传递性排序呢,就跟本时间线中的upsuper不懈追求着正态分布一样……
另,序数效用论不要求所有物品之间都一定要比个高低的,是允许两种物品具有同等效用的,所以如果遇到可传递性实在不能满足的情形,就把几部作品放到一档就好;不过从国情出发,如果一个文艺作品评分系统真的允许两部作品不分优劣的话,我知道一定是会有懒人像我说的那样,把一千部作品统统放在一档,不予比较的,那就没意义了啊……
既然这样我们就祭出最后的法宝来吧:竞价排名,一试就灵。土豪PK,胜者为王。
(假定总共有999部动画
你试试呗
http://rankit.ikely.me/
它抓取了BGM的评分数据,并使用了多种数据处理方式作出了多种评分,也包含了相对分值,具体的看不太懂,精神应该是有的。
看完全篇我的感觉:读取多用户主观评价体系并通过数据处理转换成可以消除体系差异的单一客观体系是没有办法简单实现的。
相对分数、加权法等简单暴力的算法改进都无法“完全”消弭用户间阅历不同导致的一系列上面讨论过的问题。
至于那个网站水平有限不太懂
确实不可能完全,只能说不断改进。如果说某天真的要改,我认为最有可能先引入用户评分均值。
倒是希望BGM能让人自己添加个自定义排名,让用户自己选择抓取跟自己三观接近的作为基础数据排名
这种自定义要实用需要基数足够大,可能还需要系统帮忙推荐用户,还要自己把关审核,绝对满足爱折腾的评分系统厨的蛋疼
好像有网站是有类似功能的,我听说后自己脑洞了一下233