#1 - 2010-3-29 18:12
‌aligo
基于群众纷纷强烈推荐(我到现在还不是很喜欢tag方式)的tag方式进行关联(不能说推荐了)

测试数据:
Bangumi的tag_list表
生成日期: 2010 年 03 月 28 日 17:09
tag数据:104,379条,4.3 MB
有效项目:3,219条

测试条件:
CentOS 32bit
Xeon 3.06GHz * 1
512MB RAM
MySQL 5.1.41
PHP 5.3.1

测试结果:
学习计算复杂度:每项目0.1~0.4s*3,219条,共花费约11分钟完成记忆库学习
学习空间复杂度:为一个{mediumint,mediumint,float,smallint}的双索引记忆库,共10,354,500条,128.4 MB
推荐计算复杂度:一次查询,时间在0.001s以下
#2 - 2010-3-29 18:17
结果举例:
A.与id=1424:K-ON关联前十的为:
id=3774:K-ON 第二季
id=887:仰望天空的少女瞳中的世界
id=2454:MUNTO 天上人与亚克托人最后的战斗
id=876:CLANNAD ~AFTER STORY~
id=1545:鹤屋和熏干酪
id=274:Kanon(京都)
id=51:CLANNAD -クラナド-
id=276:幸运星
id=485:凉宫春日的忧郁
id=1010:凉宫春日酱的忧郁
#3 - 2010-3-29 18:21
B.与id=3477:空之音关联前十的为:
id=1950:钢琴恋曲
id=976:CLANNAD ~AFTER STORY~
id=1424:K-ON
id=276:LUCKY STAR
id=51:CLANNAD -クラナド-
id=274:Kanon(京都)
id=1545:鹤屋和熏干酪
id=887:仰望天空的少女瞳中的世界
id=1424:K-ON
id=2790:好想告诉你
#4 - 2010-3-29 18:24
C.与id=2667:机动战士Z高达关联前十的为:
id=1010:机动战士高达OO第二季
id=286:机动战士高达OO
id=3113:机动战士高达UC
id=247:银魂
id=1671:化物语
id=876:CLANNAD ~AFTER STORY~
id=265:EVA
id=1860:机动战士高达 SEED
id=276:LUCKY STAR
id=974:深渊传说
#5 - 2010-3-29 18:31
令人失望的目前Sorami关联出的条目在数据支持充足的情况下只能推荐出同系列、同监督、同制作公司、同原作者、同声优、同类型的作品

作为推荐支持系统不助于用户发现同一种口味的新作品

下一步准备做的让Mio和Sorami一起工作-A-
#6 - 2010-3-29 18:36
另外目前tag_list里的数据似乎在不同条目类型(动画、音乐)中是区别开的
于是基于这种限制无法在某个类型下关联出其他类型但tag相似的项目

bangumi为什么不把tag做成全局的啊-口-
#6-1 - 2010-3-29 18:56
Sai🖖
下个版本也许会把tag全站统一了
#7 - 2010-3-29 19:42
(この道行きの最後が天国か?そこらじゃあないとしても.. ...)
睾科技,完全没有看懂
#8 - 2010-3-31 17:17
(令人头痛的事还真多啊~)
我感到压力很大 T,T