目前计划想做的是对演出项目进行标签细化,每个项目进行细化分类,
演出类型(话剧,音乐剧,舞台剧,音乐会,讲座,,,)
原创性(原创 改编)
时代(古代,近现代)
类型(爱情 武侠 奇幻 仙侠 游戏 传奇 科幻 童话 惊悚 悬疑)
风格(悲剧 正剧 轻松)
标签()
这里是最核心的部分,这里可以是一些大ip直接作为分类,做到从观众角度进行分类。不能是教科书式的分类,因为观众不会说是我只喜欢看古代,只喜欢看爱情,或者只看话剧,
每个人的口味都是立体的,综合的,就拿看书来说吧,我看网络小说,可我也喜欢看《月亮与六便士》,我喜欢看动漫,可我也会去看纪实片。我们的对象是人,虽然是做演出项目分类,可也最终其实做的是用户推荐【参见高大上的用户推荐系统】,当然作为非互联网行业,照搬是行不通的。
这就是大概思路了。
之前想的是自己手动打标签,现在想想,真的愧对自己的专业了【虽然学的一般】
另外一个思路是:那每个项目的文字介绍,社交平台上的评论(豆瓣,微博等)分析项目标签。
主要是,第一个思路有个问题是,标签不能完全的终于用户,你想的,终究和用户和观众是有距离的,如果只是在项目后面自己想想就填的话,真的不敢保证做出来的分类有多大的参考价值。另外也是不利于以后的维护。
就第二种方式和开发的朋友聊了下,目前来看确实可行的,可能会略微涉及深度学习类的内容。
我觉得大概分三个阶段吧:
第一:查资料,查实现方法
第二:试水,先选一个演出类型下的一个项目分析,
第三:由点画线,拓展到一个演出类型
第四:由线画面,完成全部类型
第五:投入使用
2019.7.31
我觉得我重点有些偏了,这两天一直在看中文文本分类,可是,可以用的基础是有大量的文本信息,这是前提,那么又如何训练制作出来呢?在目前数据量的不大的情况下,标签体系的结构更重要,“吾日三省吾身”,一定一定要时刻记住辨清主次,不一定因为难度高出来的效果就好。背了几年的的“从事实出发,实事求是”不要忘了。当然这些技术在后面完善的时候肯定要涉及的,但是现在是第一版,第一版!
网友评论