1、清洗数据,主要是格式抓换,编码转换。 2、文本分类,主要用fasttext。 3、关键词抽取,主要靠词库。 4、相似度排序,用word2vec。 5、上线,写完接口,然后发布soap服务。
本文标题:possible work
本文链接:https://www.haomeiwen.com/subject/kwtokctx.html
网友评论