美文网首页python热爱者
python爬虫神器,自动判断网页编码格式,无需手动查询!

python爬虫神器,自动判断网页编码格式,无需手动查询!

作者: 48e0a32026ae | 来源:发表于2018-09-26 13:57 被阅读0次

1.chardet下载地址

https://pypi.python.org/pypi/chardet/3.0.4#downloads

2.解压安装

3.打开windows命令行窗口

示例代码:

importchardet

importurllib

#可根据需要,选择不同的数据

TestData=urllib.urlopen('http://www.163.com/').read()

printchardet.detect(TestData)

运行结果:

{'confidence':0.99,'encoding':'GB2312'}

GB2312 则是编码

相关文章

网友评论

    本文标题:python爬虫神器,自动判断网页编码格式,无需手动查询!

    本文链接:https://www.haomeiwen.com/subject/hubdoftx.html