本子战士 (B站难民)
X可以是作品的meta data,Y是评分
========================
这里的meta data包括但不限staff表,制作公司,staff履历,作品时间。但是不包括作品内容。
========================
突然炸出来好多ML的大佬。。。。
========================
再解释一下,并不是想为动画质量做AI评分,而是以整体性的视角预测bangumi群体对某一作品的评分。
如果有读过《基地》系列的,可以类比里面的心理史学。
是說對全視頻嗎? 比較擔心運算量呢.
感覺像碼率這些直接信息用視頻壓縮方法就可以提取到的特徵沒有全部放進運算.
而像是情節什麼的又因為數據量太小(幾萬部番?)、且沒有準確的supervision、得不出有意義的結果.
(剛意識到「監督」有歧義 )
不过统计模型的前提都是我们可以搞清楚数据的情况:例如评分是不是一个 stationary & ergodic process, error 是不是 conditionally homoskedastic & uncorrelated, 其他 regressors 是不是 endogenous 之类的;另外评分只能在 [0, 10] 之内,所以一般 estimator 都不太好(就类似于 OLS linear probability model 预测 binary dependent variable 不如用 logit 那样),所以我们还必须去找某种不知道是否存在的冷门 estimator... 这种事情太可怕了,还是ML更友好...
话说回来,我对ML不太放心的地方在于这东西就是个黑盒子,基本上无法理解到底发生了什么(或者为什么机器这样学习是对的),我们根本就不知道这个 estimator (?) 的 asymptotic behavior,所以也就不知道究竟是否该相信这个预测,但做了半天预测评分却没办法说服自己去相信这个预测就太悲剧了,得出结论是玄学更好
腦補過多以為是 RNN 了.
總之 RNN 放到下面視頻流那邊討論吧.
蹲了两年,补番经验来看 好番并不是很多。可以对动画基本信息 staff 建立图和各种大数据label 手动调参 实现模型
其实角色也很重要,拿il2vec解析分类一下做成网络图也是可以的
这些都应该视作实例,并赋予不同的权重
学术角度看,动画只是表达手法。也许实现出来也只是原作者的理想。以至于作为乌托邦看待
这一点也没错,毕竟动画之类的都是现实人造的(几个月前补了白箱 顿悟)
最近填坑磊的一点数据格式
不过也会有少数作品例外,比如《为这个美好世界献上祝福》的故意崩,又或者是用棒读/非常规的演出作为萌点的声优(《噬魂师》《黄段子》的破音姬)
實話說按照個人經驗「故意崩」的例子絕對是不少的.
所以别想着什么都用AI/ML
你们engineer只会炫技,但是解决不了用户痛点的炫技并没有卵用呀
后端工程师:我们搞的是ML不是魔术,这个技术并不存在,请5年后再来找我
前端工程师:bug都堆成山了,你还让我去做UI动画?呵呵哒
产品经理:Naive!这功能又赚不了几个钱,赏你个优先级P4 S4吧
大老板:颜色太鲜艳 插图太多 用词太卖萌,我们是严肃的B2B产品不是卡通片,高端大气你懂吗,高端大气
[掏出删减成屎一样的设计稿]
前后端工程师:这个容易实现,我喜欢
产品经理:这个能赚钱,我喜欢
大老板:这个低调的UI一看就是专业软件,我喜欢
LGTM