美文网首页
python 爬虫遇到的内容乱码问题

python 爬虫遇到的内容乱码问题

作者: 王镇_ee87 | 来源:发表于2020-12-21 08:49 被阅读0次

    今天闲的无聊,找个小说看看,但是在爬的过程中出现乱码,如下图


    image

    猜想是编码问题,打印当前的编码

    req = session.get(url)
    print(req.encoding)
    

    结果是

    ISO-8859-1
    

    询问大佬,得以解决

    req.encoding = req.apparent_encoding
    print(req.encoding)
    

    结果是GB2312
    问题解决

    image

    但是这个自动取编码很影响效率还是别用了 直接指定较好

    req.encoding = 'GB2312'
    

    以后想知道 编码是啥 去源码里 搜 charset 字段
    或者

    print(ret.apparent_encoding)
    

    然后在指定一下就好了

    相关文章

      网友评论

          本文标题:python 爬虫遇到的内容乱码问题

          本文链接:https://www.haomeiwen.com/subject/jwzbwktx.html