-
训练的wordvectors(词向量, .npy文件)后numpy Dataframe数据类型是‘’,网上的解释是:dtype='<U12'是numpy中表示长度为12位的unicode类型数据。
1.png
2.png
而我现在需要datatype = <'numpy.float32'> 的数据,进行类型转换:
3.png
成功。
这个问题浪费了我挺久的时间,一直查怎样训练出格式为float32的词向量文件,还查了好多gensim的东西,以及编码解码的东西,真是傻掉了。 - 收集一下新纳知识点:
- decode,encode的区别和用法
- 字符串通过编码转换为字节码,字节码通过解码转换为字符串
str--->(encode)--->bytes,bytes--->(decode)--->str
网友评论