动机:为了把从各地搜刮来的黄油,里番,本子进行分类,我们自然希望靠脚本从数据库里查询到所下载的文件对应的游戏,获取更多的信息。比如可以查询到黄油对应的会社名称,从而进行整理。
问题描述:不同人上传的文件起的文件名大部分都是乱的。比如“[101224]Tiny Dungeon ~BLESS of DRAGON~(iso+mds+rr3)”或者是“[160624] [ぱれっとクオリア] オトメ*ドメイン + Drama CD + Radio CD + Manual + Wallpaper”。直接让脚本去查询整个文件名肯定是不会得到什么好结果的。
去掉一部分,看起来结果还不错
再去掉一点:
结果又不行了
但是起文件名规则都不一样,有的是方括号,有的是圆括号,有的是“+”,“_”等等,那么到底该取哪一部分进行查询呢?
解决办法:思路从一开始就错了。不应该是把资源和数据库对应,而应该是按数据库的名称去查找资源。
提高源的质量才是最根本的办法。现在基本只拖某站带有id的页面里的资源,还有bt站单一的一手源。
(现在的问题是重新打包的代价太大了……而且还是需要整理)
解决不了就准备每季度人工匹配了233
更别说有的是罗马音,有的是片假名,有的直接上英文名,还有的混着来。
贴吧弄的cxx本子合集,都是这种鬼德行。
给编号这件事本身又不难
https://bgm.tv/group/topic/346533
问题发资源的人不会去加这个代码。