美文网首页
朴素贝叶斯中报错UnicodeDecodeError: 'utf

朴素贝叶斯中报错UnicodeDecodeError: 'utf

作者: Max_Maxwell | 来源:发表于2021-05-05 09:03 被阅读0次

在机器学习第四章朴素贝叶斯中进行垃圾邮件分类时,原语句:

wordList = textParse(open('email/spam/%d.txt' % i, 'rb').read())

报错:UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 884: invalid start

改正方法:

第一种,修改为:wordList = textParse(open('email/spam/%d.txt' % i, 'rb').read().decode('utf8','ignore'))

第二种:在终端用vim分别打开文件,输入set,查看那个不是utf-8的编码,然后set fileencoding=utf-8,保存退出(这个方法没有试过)

参考的链接python编码错误解决:UnicodeDecodeError: 'utf-8' codec can't decode byte 0x92 in position 884: invalid start_wiki347552913的博客-CSDN博客

相关文章

网友评论

      本文标题:朴素贝叶斯中报错UnicodeDecodeError: 'utf

      本文链接:https://www.haomeiwen.com/subject/sprkdltx.html