python读取文本文件报错：UnicodeDecodeErro

python读取文本文件报错：UnicodeDecodeErro

作者: 逍遥叹不逍遥 | 来源:发表于2020-11-11 16:40 被阅读0次

python读取文本文件报错：UnicodeDecodeErro
python读取csv文件报错UnicodeDecodeErro
python读取ANSI文本乱码问题
TypeError: 'newline' is an inval
python | 读文件编码问题 | UnicodeDecode
Python读取整个文件（101）
python配置文件报错怎么解决
python读取文件时报错
python 读取文件时报错
Python 学习记录

问题描述：爬虫从网络上爬取的 HTML 文件中含有一段疑似乱码的文字（应该是由于转换编码格式导致的乱码），在使用 python 读取改文件时尝试使用了多种编码格式，均报错。

环境：python3.8.0

乱码片段

使用 Notepad ++ 打开后右下角显示编码格式为 GB2312，但使用代码读取时依然报错：

读取代码

报错信息

尝试其它编码方式-GBK

尝试其它编码方式-utf-8

后来发现在 Windows 下使用 ANSI 竟然可以正常读取，但是查询电脑默认编码格式：

C:\Users\Administrator>chcp

活动代码页: 936

936 即代表 GBK，但直接使用 GBK 去读取却仍然报错，这点让我困惑，而且我最终使用环境为 Linux，就没有再追下去。

最后的解决方式：

相关文章

python读取文本文件报错：UnicodeDecodeErro
问题描述：爬虫从网络上爬取的 HTML 文件中含有一段疑似乱码的文字（应该是由于转换编码格式导致的乱码），在使用 ...
python读取csv文件报错UnicodeDecodeErro
今天要处理大量的csv文件，出现UnicodeDecodeError: 'utf-8' codec can't d...
python读取ANSI文本乱码问题
文本文件是ANSI保存，以ISO-8859-1保存，Python读取报错: 修改方式如下： line为什么不直接d...
TypeError: 'newline' is an inval
下面是一个使用glob读取多个文本文件的代码，在mac终端运行后报错是因为输出python是调用mac自带的py...
python | 读文件编码问题 | UnicodeDecode
python读取文本文件，报GBK错误报错如下报这个错，问题一般出在两个地方 1、编码设置第一行没有设置 2、...
Python读取整个文件（101）
操作流程：创建文本文件，读取文本文件内容。 python大大的图我的图 open()：打开文件参数：要打开的文...
python配置文件报错怎么解决
python 读取配置文件总是报错configparser.NoSectionError: No section:...
python读取文件时报错
python读取文件时报错 UnicodeDecodeError: 'gbk' codec can't decod...
python 读取文件时报错
python 读取文件时报错：UnicodeDecodeError: 'gbk' codec can't deco...
Python 学习记录
python 读取表格此时由于没有导入openpyxl 会有报错：ModuleNotFoundError: No...

网友评论

本文标题：python读取文本文件报错：UnicodeDecodeErro

本文链接：https://www.haomeiwen.com/subject/smoebktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|python读取文本文件报错：UnicodeDecodeErro|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！