学习所用,可随意转载,转载请注明出处,或在本文下方留言说明即可,谢谢!
对于一个中文文本分词,运行出错,结果如下:
'utf-8' codec can't decode byte 0xb2 in position 0: invalid start byte
万恶的编码问题,初步可以看出事编码问题,突然想到txt文件自带编码,赶紧打开发现
![](https://img.haomeiwen.com/i2326415/b30e17bd9b485cc1.png)
果然是默认的编码是“ANSI”,改为“utf-8”即可。
学习所用,可随意转载,转载请注明出处,或在本文下方留言说明即可,谢谢!
对于一个中文文本分词,运行出错,结果如下:
'utf-8' codec can't decode byte 0xb2 in position 0: invalid start byte
万恶的编码问题,初步可以看出事编码问题,突然想到txt文件自带编码,赶紧打开发现
果然是默认的编码是“ANSI”,改为“utf-8”即可。
本文标题:wordcloud中文分词的问题
本文链接:https://www.haomeiwen.com/subject/tcuwfxtx.html
网友评论