美文网首页python热爱者
python爬虫神器,自动判断网页编码格式,无需手动查询!

python爬虫神器,自动判断网页编码格式,无需手动查询!

作者: 48e0a32026ae | 来源:发表于2018-09-26 13:57 被阅读0次

    1.chardet下载地址

    https://pypi.python.org/pypi/chardet/3.0.4#downloads

    2.解压安装

    3.打开windows命令行窗口

    示例代码:

    importchardet

    importurllib

    #可根据需要,选择不同的数据

    TestData=urllib.urlopen('http://www.163.com/').read()

    printchardet.detect(TestData)

    运行结果:

    {'confidence':0.99,'encoding':'GB2312'}

    GB2312 则是编码

    相关文章

      网友评论

        本文标题:python爬虫神器,自动判断网页编码格式,无需手动查询!

        本文链接:https://www.haomeiwen.com/subject/hubdoftx.html