response.text和response.content的区别
- response.text
类型:str
解码类型:requests模块自动根据http头部对响应的编码做出推测,推测返回文本的编码格式,如果使用这种方式接收,如果猜测错误会导致乱码
- response.content
类型:bytes
解码类型:没有指定,我们接收到之后可以按照自己想要的方式进行转换
例如:以下--test.py
import requests
url = 'http://www.baidu.com'
response = requests.get(url)
response.encoding = 'utf8'
print(response.text)
#第二种方式
url = 'http://www.baidu.com'
response = requests.get(url)
#不传也行,默认就是utf-8
print(response.content.decode('utf-8'))
通过对response.content进行decode,来解决中文乱码
- response.content.decode() 默认utf-8
- response.content.decode("gbk")
- 常见的编码字符集
1.utf-8
2.gbk
3.ascii
4.iso-8859-1
网友评论