#1 - 2024-1-10 19:40
Chernobergs
先声明利害关系:我是从16年开始知道bangumi来看每一季新番的评分,但是直到今天才注册账号。同时,我对滚,Go,危S1这三部动画评价都很高,如果我真的评分,我对它们的评分可能都是10分(当然我现在没有参与评分)。
以下是正文。
暴论:带排名的10分制(也就是现在Bangumi的评分体系)就应该扫进历史的垃圾堆。
这里的“带排名的10分制”指代任何试图仅靠一个数字来衡量一个艺术创作作品好坏的评分制度,后简称为10分制。
当我们仅靠一个数字给一个什么东西打分的时候,这个分数的值的意义是什么?
举个例子,说对于数学考试的分数,它的值可以看作是掌握程度百分比的一个估计:如果你是满分,那么我有理由认为你对考试范围内知识掌握的程度接近100%;如果你是零分,那我同样有理由认为,你对考试范围内知识掌握程度接近0%。
我认为,数学考试的评分体系是一个合理的评分体系,因为作为一个试图寻找客观唯一值的体系,它满足:1、对于可能存在的任何一种分数,都存在至少一种答案与之对应2、答案唯一决定分数,不受其他任何因素的影响。第一条能够保证这个分数值作为榜样的合理性,第二条能够保证这个分数值作为比较的合理性。
为什么我觉得10分制不合理?首先它不满足上述的第一个条件。你是一个读者观众,你看完一本书或者一部电影或者一部番剧,突然有一个打分的系统从0分到10分,但是你不会知道这个分数代表着什么:10分的作品应该是什么样子的?0分的作品应该是什么样子的?你想给这个作品打8分,那8分附近的作品有哪些?这些,我们通通不知道,创立打分系统的人也没有提供。在这样的条件下,你所给出的“8”这个数字蕴含了多少信息?这些信息和这部作品本身的信息相比又损失了多少?
同时,它也不满足上述的第二个条件。这个很好理解。性别不同,年龄不同,生活区域不同,所受教育不同,过往经历不同等等的这些差异,使我们不能对一部作品做出同样的甚至说相近的评价。不过这个是可以接受的,因为这些差异同样也能反过来反应作品本身的素质。真正不能接受的是,即使同一个个体,对同一部作品的评分,也会因为其他因素而产生不小的变化。比如对A作品评价时,是否看过B作品可能会对它产生影响;仅以番剧而言,追番完成后给到分数和补番完成后给的分数也是不同的,但是这些东西和作品本身的素质没有关系。
以上是我对10分制的“不合理性”的论证,如果各位对“合理”的定义与我不同,我也想用另一种方式来解释10分制的缺陷:
如果存在一种10分制能够客观正确的衡量不同作品的好坏程度,那么这个制度和“一张客观正确的对所有作品的排名表”是等价的:前者能够产生后者,后者也能够产生前者。很显然,后者是做不到的,那么前者自然不能存在。换言之,“10分制”“客观正确”“衡量好坏”三者不能同时存在。显然后两者是我们所必须的(毕竟排行榜嘛),那么我们就只能将不需要的10分制给舍弃了。
归根结底,一个数字所能蕴含的信息量实在是太少了,就连我点完外卖之后对这次订单的评价,都至少要三个数字呢,对于动辄数十万字的小说,12集x24分钟的动画,100分钟以上的电影等等而言,仅用一个数字来做总结损失了太多的信息。能够“客观正确的衡量好坏”的评分体系存在吗?我不知道,不过我觉得10分制一定是离这个美妙的正确答案比较遥远的一位。
最后,我也不是什么动漫高手,如果各位不喜欢就当看赛博小丑吧。
以下是正文。
暴论:带排名的10分制(也就是现在Bangumi的评分体系)就应该扫进历史的垃圾堆。
这里的“带排名的10分制”指代任何试图仅靠一个数字来衡量一个艺术创作作品好坏的评分制度,后简称为10分制。
当我们仅靠一个数字给一个什么东西打分的时候,这个分数的值的意义是什么?
举个例子,说对于数学考试的分数,它的值可以看作是掌握程度百分比的一个估计:如果你是满分,那么我有理由认为你对考试范围内知识掌握的程度接近100%;如果你是零分,那我同样有理由认为,你对考试范围内知识掌握程度接近0%。
我认为,数学考试的评分体系是一个合理的评分体系,因为作为一个试图寻找客观唯一值的体系,它满足:1、对于可能存在的任何一种分数,都存在至少一种答案与之对应2、答案唯一决定分数,不受其他任何因素的影响。第一条能够保证这个分数值作为榜样的合理性,第二条能够保证这个分数值作为比较的合理性。
为什么我觉得10分制不合理?首先它不满足上述的第一个条件。你是一个读者观众,你看完一本书或者一部电影或者一部番剧,突然有一个打分的系统从0分到10分,但是你不会知道这个分数代表着什么:10分的作品应该是什么样子的?0分的作品应该是什么样子的?你想给这个作品打8分,那8分附近的作品有哪些?这些,我们通通不知道,创立打分系统的人也没有提供。在这样的条件下,你所给出的“8”这个数字蕴含了多少信息?这些信息和这部作品本身的信息相比又损失了多少?
同时,它也不满足上述的第二个条件。这个很好理解。性别不同,年龄不同,生活区域不同,所受教育不同,过往经历不同等等的这些差异,使我们不能对一部作品做出同样的甚至说相近的评价。不过这个是可以接受的,因为这些差异同样也能反过来反应作品本身的素质。真正不能接受的是,即使同一个个体,对同一部作品的评分,也会因为其他因素而产生不小的变化。比如对A作品评价时,是否看过B作品可能会对它产生影响;仅以番剧而言,追番完成后给到分数和补番完成后给的分数也是不同的,但是这些东西和作品本身的素质没有关系。
以上是我对10分制的“不合理性”的论证,如果各位对“合理”的定义与我不同,我也想用另一种方式来解释10分制的缺陷:
如果存在一种10分制能够客观正确的衡量不同作品的好坏程度,那么这个制度和“一张客观正确的对所有作品的排名表”是等价的:前者能够产生后者,后者也能够产生前者。很显然,后者是做不到的,那么前者自然不能存在。换言之,“10分制”“客观正确”“衡量好坏”三者不能同时存在。显然后两者是我们所必须的(毕竟排行榜嘛),那么我们就只能将不需要的10分制给舍弃了。
归根结底,一个数字所能蕴含的信息量实在是太少了,就连我点完外卖之后对这次订单的评价,都至少要三个数字呢,对于动辄数十万字的小说,12集x24分钟的动画,100分钟以上的电影等等而言,仅用一个数字来做总结损失了太多的信息。能够“客观正确的衡量好坏”的评分体系存在吗?我不知道,不过我觉得10分制一定是离这个美妙的正确答案比较遥远的一位。
最后,我也不是什么动漫高手,如果各位不喜欢就当看赛博小丑吧。
非要说的话,我的观点是,要么放弃排名的客观正确性(也就是承认“我们这个排名就是许多人的主观选择的综合,并不代表作品实际的素质”),要么就不要排名了,只做一个带分类的评分。
如果非要一个“新的”评分体系的话,我倾向于对于作品的不同素质分别评分,就像我说的外卖的评价一样。