一文读懂keras文本预处理

作者: Babyzpj | 来源:发表于2018-04-25 16:24 被阅读0次

本文四个图，第四个图最重要（要用到一个名叫Tokenizer类中的.texts_to_matrix(textList, mode="tfidf")）

原因如下： 可以很方便的将文本序列（每篇档分过词，每篇序列用空格作为分隔符并join在一起的语料列表）转化为向量矩阵。而这正是NLP预处理中非常关键的一步。

图一、

图二、one-hot

图三、hash_trick

图四 Tokenizer类的使用

网友评论

本文标题：一文读懂keras文本预处理

本文链接：https://www.haomeiwen.com/subject/ipjylftx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！