- 在使用requrests包获取html文件时候,对于中文可能会有编码问题,此时需要设置
r.encoding="UTF-8"
,另外,对于链接获取报错的异常问题,使用try except
来进行处理,方法如下:
import requests
url="http://www.baiduxxx.com"
try:
r=requests.get(url,timeout=1)#timeout为链接时间,不包括下载时间
r.encoding="UTF-8"
print r.url
print r.encoding
print r.text
except requests.ConnectionError as e:
print url+" : is out"
网友评论