最近学习了NLP中的文本向量化的方法,在此做一个整理,一方面帮助自己梳理思路,另一方面以便自己将来快速回顾。
文本向量化总体框图
文本向量化总体框图.jpg目前整理的文本想量化方式有离散表示和分布式连续表示两大类。离散表示方式包括one-hot,tfidf,N-gram以及共现矩阵等方式。分布式连续表示有word2vec和fasttext等方式。
最近学习了NLP中的文本向量化的方法,在此做一个整理,一方面帮助自己梳理思路,另一方面以便自己将来快速回顾。
目前整理的文本想量化方式有离散表示和分布式连续表示两大类。离散表示方式包括one-hot,tfidf,N-gram以及共现矩阵等方式。分布式连续表示有word2vec和fasttext等方式。
本文标题:文本向量化学习笔记
本文链接:https://www.haomeiwen.com/subject/ndvcnctx.html
网友评论