1.手动实现
2.分析页面数据 1查看源代码 2查看是否是ajax异步加载(抓包)3解密(json)
请求的URL;请求的方式post/get;请求的参数
最基本的反爬手段:判断浏览器信息/IP
返回协议头信息
decode 解码 把其他编码转换成unicode编码 decode('gbk').encode('utf-8')
encode 编码 把unicode编码成其他编码
3.拼接
1.手动实现
2.分析页面数据 1查看源代码 2查看是否是ajax异步加载(抓包)3解密(json)
请求的URL;请求的方式post/get;请求的参数
最基本的反爬手段:判断浏览器信息/IP
返回协议头信息
decode 解码 把其他编码转换成unicode编码 decode('gbk').encode('utf-8')
encode 编码 把unicode编码成其他编码
3.拼接
本文标题:爬虫思维
本文链接:https://www.haomeiwen.com/subject/ycnsaqtx.html
网友评论