python 爬虫编码(encoding和apparent_en

python 爬虫编码(encoding和apparent_en

作者: 乂尤先生 | 来源:发表于2020-11-16 16:16 被阅读0次

python 爬虫编码(encoding和apparent_en
python学习笔记|数据格式化——JSON解析
PY2和PY3的区别
查看修改文件编码格式
Python爬虫编码
解决使用request库爬取内容出现乱码的问题
java中file.encoding与sun.jnu.encod
字符集和字符编码
Python 原生爬虫小项目 -- 爬取熊猫TV 英雄联盟游
数据预处理：标称型特征的编码和缺失值处理

前言

在爬虫有时会遇到类似å¥½å�¬ç��é�³ä¹�ï¼�å¥½ç��ç��MVé�½å�¨è¿�é��äº�ï¼�å��æ¬¢è®°å¾�ç»�æ��ä¸�ä¸ªå ³æ³¨å�¦ï¼�格式的编码,很是头疼。如何解决这种问题呢？下面来看一下编码方法

requests编码

属性	说明
r.encoding	从http header中提取响应内容编码
r.apparent_encoding	从内容中分析出的响应内容编码

encoding是从http中的header中的charset字段中提取的编码方式，若header中没有charset字段则默认为ISO-8859-1编码模式，则无法解析中文，这是乱码的原因。
apparent_encoding会从网页的内容中分析网页编码的方式，所以apparent_encoding比encoding更加准确。当网页出现乱码时可以把apparent_encoding的编码格式赋值给encoding。

解决乱码

import requests
url = "********"
reqs= requests.get(url)
reqs.encoding = reqs.apparent_encoding 
print(reqs.text)

相关文章

python 爬虫编码(encoding和apparent_en
前言在爬虫有时会遇到类似å¥½å�¬ç��é�³ä¹�ï¼�å¥½ç��ç��MVé�½å�¨è¿�é��äº�...
python学习笔记|数据格式化——JSON解析
Json解析包括编码（encoding）与解码（decoding）。编码是将python数据类型转换为json格式...
PY2和PY3的区别
1.编码 python2默认编码方式ASCII码（不能识别中文，要在文件头部加上 #-- encoding：ut...
查看修改文件编码格式
查看文件编码 file ip.txt 转换编码 iconv -f encoding -t encoding inp...
Python爬虫编码
问题 reponse.encoding 默认为 gb2312, 出现部分中文乱码解决方法将response.e...
解决使用request库爬取内容出现乱码的问题
刚开始爬虫经常会被编码问题坑，今天看了python的requests库的官方文档和几种常见编码的关系,在这里做个简...
java中file.encoding与sun.jnu.encod
file.encoding为文件内容的编码格式sun.jnu.encoding为操作系统的默认编码格式
字符集和字符编码
一篇很好地字符集和字符编码的详细介绍字符集和字符编码（Charset & Encoding）
Python 原生爬虫小项目 -- 爬取熊猫TV 英雄联盟游
编写这个原生爬虫项目的3个主要目的: 1.巩固 python 基础知识2.了解合理的编码规范和方式3.了解爬虫基本...
数据预处理：标称型特征的编码和缺失值处理
数据预处理：标称型特征的编码和缺失值处理标称型特征编码(Encoding categorical feature...

网友评论

Python

本文标题：python 爬虫编码(encoding和apparent_en

本文链接：https://www.haomeiwen.com/subject/qvhzbktx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

Python

关于我们|服务条款|联系我们|python 爬虫编码(encoding和apparent_en|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！