美文网首页
爬虫思维

爬虫思维

作者: writ | 来源:发表于2019-05-14 16:51 被阅读0次

    1.手动实现
    2.分析页面数据 1查看源代码 2查看是否是ajax异步加载(抓包)3解密(json)
    请求的URL;请求的方式post/get;请求的参数
    最基本的反爬手段:判断浏览器信息/IP
    返回协议头信息
    decode 解码 把其他编码转换成unicode编码 decode('gbk').encode('utf-8')
    encode 编码 把unicode编码成其他编码
    3.拼接

    相关文章

      网友评论

          本文标题:爬虫思维

          本文链接:https://www.haomeiwen.com/subject/ycnsaqtx.html