gensim中word2vec一些补充

作者: 大头青年 | 来源:发表于2017-11-23 21:21 被阅读17次

存储和加载模型

存储、加载模型的方法如下:

>>>model.save('/tmp/mymodel')

>>>new_model = gensim.models.Word2Vec.load('/tmp/mymodel')

保存为txt格式：

model.wv.save_word2vec_format('wordvec.txt')

可以直接加载由C生成的模型:

model = Word2Vec.load_word2vec_format('/tmp/vectors.txt', binary=False)

#using gzipped/bz2 input works too, no need to unzip:

model=Word2Vec.load_word2vec_format('/tmp/vectors.bin.gz', binary=True)

可以在加载模型之后使用另外的句子来进一步训练模型

model = gensim.models.Word2Vec.load('/tmp/mymodel')

model.train(more_sentences)

不能对C生成的模型再训练

model.most_similar(positive=['woman','king'], negative=['man'], topn=1)

[('queen',0.50882536)]

model.doesnt_match("breakfast cereal dinner lunch".split())

'cereal'

model.similarity('woman','man')

.73723527

网友评论

本文标题：gensim中word2vec一些补充

本文链接：https://www.haomeiwen.com/subject/cjqcvxtx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！