美文网首页
分享一款抓取网页编码格式的工具——chardet

分享一款抓取网页编码格式的工具——chardet

作者: 段好鹏 | 来源:发表于2020-05-23 17:06 被阅读0次

    安装

    • pip list chardet

    使用

    • import chardet
    • chardet.detect(r.content) 返回字典,其中 confidence是检测精确度,encoding是编码形式。

    例子

    import requests
    r = requests.get("http://www.baidu.com")
    r.encoding = chardet.detect(r.content)['encoding']
    

    相关文章

      网友评论

          本文标题:分享一款抓取网页编码格式的工具——chardet

          本文链接:https://www.haomeiwen.com/subject/qerlahtx.html