美文网首页
scrapy编码猴子补丁

scrapy编码猴子补丁

作者: ArtioL | 来源:发表于2021-03-04 11:32 被阅读0次

案例 https://worldjpn.grips.ac.jp/documents/indices/pm/3.html

# encoding.py
from w3lib import encoding
import chardet
import chardet.charsetprober


_html_body_declared_encoding = encoding.html_body_declared_encoding


def html_body_declared_encoding(html_body_str):
    res = _html_body_declared_encoding(html_body_str)
    if res:
        return res
    guess = chardet.detect(html_body_str)
    if guess and guess['confidence'] > 0.2:
        return guess["encoding"]


encoding.html_body_declared_encoding = html_body_declared_encoding

在spider同级目录init引入encoding

import encoding as _

实测 注释掉import


WeChat00f51309f1634ada7dba2387a195a12b.png

使用补丁


WeChat022872536e6ea6a152ff72e96a2ff954.png

相关文章

  • scrapy编码猴子补丁

    案例 https://worldjpn.grips.ac.jp/documents/indices/pm/3.ht...

  • 猴子补丁的由来

    转:什么是猴子补丁 所谓的猴子补丁的含义是指在动态语言中,不去改变源码而对功能进行追加和变更。猴子补丁的这个叫法起...

  • 猴子补丁

  • 猴子补丁

    属性在运行时的动态替换,叫做猴子补丁(Monkey Patch)。猴子补丁的叫法有些莫名其妙,只要和“模块运行时替...

  • 猴子补丁

    1.遇到的问题使用协程的时候看到网上的例子在程序开头都要加上from gevent import monkey m...

  • Python猴子补丁

    属性在运行时的动态替换,叫做猴子补丁(Monkey Patch)。 为什么叫猴子补丁 属性的运行时替换和猴子也没什...

  • Python monkey patch

    详见 什么是猴子补丁(monkey patch)

  • 猴子补丁(Monkey Patch)

    猴子补丁(Monkey Patch) 猴子补丁, 顾名思义...完全不知道是什么玩意有木有, 可能有些历史原因, ...

  • 猴子补丁(monkey patch)

    写了一段时间java切回写python偶尔会出现一些小麻烦,比如:在java中自定义对象变成json串很简单,调用...

  • json|pickle|猴子补丁

    json 1、序列化:将内存数据转成字符串加以保存。dumps2、反序列化:将字符串转成内存数据加以读取。load...

网友评论

      本文标题:scrapy编码猴子补丁

      本文链接:https://www.haomeiwen.com/subject/sdzhqltx.html