深度学习模型训练时,常常需要下载pretrained embedding,而embedding保存的格式常有.bin和txt。
将.bin文件转为.txt文件。
dependencies:python gensim
from gensim.models.keyedvectors import KeyedVectors
model = KeyedVectors.load_word2vec_format('file.bin', binary=True)
model.save_word2vec_format('file.txt', binary=False)
将txt格式转为gensim格式:
word_vectors=KeyedVectors.load_word2vec_format('/path/to/fasttext/embeddings.txt', binary=False)
word_vectors.save('/path/to/converted')
网友评论