美文网首页
爬点小黄图-2-伪装浏览器行为避免屏蔽爬虫

爬点小黄图-2-伪装浏览器行为避免屏蔽爬虫

作者: wyude | 来源:发表于2016-11-01 20:56 被阅读0次

伪装浏览器,我们要知道http,get,post,基本上这三个就够,以为暂时也没用什么高级功能。
再装个fiddler,试了下,python发出的请求它也能捕获到(毕竟,实际上它是客服端与服务器间的代理,都是走127.0.0.1:8888的),所以我们只要先用浏览器访问一下目标页面,然后把需要的header复制下来就可以了。
上一次的爬虫是直接urllib.request.urlopen(url),这回要用到urllib.request.Request


开始一个最简单的模拟,伪装


#encoding=utf-8
import urllib;
import urllib.request;

class browserTest:
    def __init__(self):
        self.__url='https://www.baidu.com';#有时也要注意http还是https,刚才就错了
        self.__header={#从fiddler复制的header,当然还有别的东西
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.84 Safari/537.36',
            'Connection': 'keep-alive'
            };

    def go(self):
        self.__req=urllib.request.Request(url=self.__url,headers=self.__header);#简单的就是再请求里面加个浏览器认证么,以及可能出现的其他条条款框都可以放到header
        self.__res=urllib.request.urlopen(self.__req);
        print(self.__res.read());

if __name__=='__main__':
    app=browserTest();
    app.go();

相关文章

  • 爬点小黄图-2-伪装浏览器行为避免屏蔽爬虫

    伪装浏览器,我们要知道http,get,post,基本上这三个就够,以为暂时也没用什么高级功能。再装个fiddle...

  • 「爬虫」06爬虫的浏览器伪装技术

    1.浏览器伪装技术原理 在爬取某些网站时,会返回403(禁止访问),因为对方服务器会对爬虫进行屏蔽,此时,需要伪装...

  • Python数据分析与挖掘实战之爬虫浏览器伪装技术

    浏览器伪装技术原理 我们可以试试爬取csdn博客,我们发现会返回403,因为对方服务器会 对爬虫进行屏蔽。此时,我...

  • 一个刷简书访问量的小程序(仅供学习,切勿他用)---Python

    爬虫经常需要伪装浏览器进行爬取数据,爬虫与反爬虫的较量无时无刻不在上演,本期介绍爬虫神器selenium库的安装及...

  • 爬虫基础面试题

    1.反爬措施 1.你写爬虫的时候都遇到过什么反爬虫措施,你是怎么解决的?设置用户代理 伪装浏览器禁止IP ...

  • python3爬虫伪装代理IP

    在爬取类似 起点 色魔张大妈 这样的网站时,会被网站看出是爬虫机制,这时需要伪装成浏览器以及使用IP代理的方式来爬...

  • EX07——API调用练习

    收集网络资源的时我们很多时候会使用爬虫技术,随着技术的发展,恶意的爬虫模拟人的行为和浏览器的行为进行信息爬取,有时...

  • python爬虫之抓取代理服务器IP

    前言 使用爬虫爬取网站的信息常常会遇到的问题是,你的爬虫行为被对方识别了,对方把你的IP屏蔽了,返回不了正常的数据...

  • Python3简单爬虫

    先从一个最简单的页面开始爬起 运行 但是往往裸奔版对一些网站是爬不了的,这时就需要对爬虫进行一些伪装了。伪装浏览器...

  • Python爬取招聘

    urllib.request 伪装 还可以冒充手机浏览器等如果网站把我们屏蔽了可以通过伪装,调用浏览器2中解决有的...

网友评论

      本文标题:爬点小黄图-2-伪装浏览器行为避免屏蔽爬虫

      本文链接:https://www.haomeiwen.com/subject/vwbeuttx.html