美文网首页方式方法
采集时被封ip的解决方法(上)

采集时被封ip的解决方法(上)

作者: 四季变幻 | 来源:发表于2015-12-14 08:43 被阅读547次

最近各种网站的采集程序写的比较多,遇到在采某网站时采到100多条时突然发现对方的网站打不开了,猜到肯定被封ip了,用了代理还是会封,这不是办法。在网上找了一些资料都没有找到,功夫不负有心人啊,在找的时侯有一个人提到了用搜索引擎爬虫蜘蛛的USERAGENT。虽然只提到一点点我还是想到了,列出我的解决方法,

1.使用Snoopy或curl传搜索引擎爬虫的USERAGENT值。

查看搜索引擎爬虫的USERAGENT值:http://www.geekso.com/spdier-useragent/

2.使用Snoopy或curl传referer值。

如:$snoopy->referer = 'http://www.google.com';

$header[] = "Referer: http://www.google.com/";

3.使用Snoopy或curl代理。

如:$snoopy->proxy_host = "59.108.44.41";

$snoopy->proxy_port = "3128";

4.使用Snoopy或curl防造IP。

如:$snoopy->rawheaders['X_FORWARDED_FOR'] = '127.0.0.1';

$snoopy->rawheaders['CLIENT-IP'] = '127.0.0.1';

5.用php写一个重起路由器的程序,这样就会获得新的ip地址。

6.如果发现重起路由器还是显示被封,有可能对方封了你路由器的mac地址,现在路由器都有修改MAC的功能,可以写程序或手动修改路由器的MAC地址。

原文:http://blog.kgula.com/ip-banned-solve-method/

相关文章

  • 采集时被封ip的解决方法(上)

    最近各种网站的采集程序写的比较多,遇到在采某网站时采到100多条时突然发现对方的网站打不开了,猜到肯定被封ip了,...

  • 采集时被封ip的解决方法(下)

    0x00 前言 一直以来,爬虫与反爬虫技术都时刻进行着博弈,而新浪微博作为一个数据大户更是在反爬虫上不遗余力。常规...

  • 怎么更换游戏ip地址

    玩游戏时IP被封是一件非常苦恼的事情,为了避免玩游戏时IP被封,就得遵守游戏规则,但想要多开账号玩,就会被限制,想...

  • 将博客搬至CSDN

    ip被封,无奈之举

  • python爬虫批量抓取ip代理

    使用爬虫抓取数据时,经常要用到多个ip代理,防止单个ip访问太过频繁被封禁。 ip代理可以从这个网站获取:http...

  • 获取本机公网ip(public ip)

    爬虫时,为了避免自己的IP被封,有时候需要设置反向代理,用其他的IP去爬。那么这里说的IP到底是电脑的什么IP呢?...

  • 【小白学爬虫连载(12)】--获取免费高匿代理IP

    欢迎关注【哈希大数据】 如何获取免费高匿代理IP 前言 我们采集信息时采集速度太大,请求速度过高,占用了大量对方服...

  • python爬虫如何使用代理IP

    作为一名数据采集者,我们都是知道,一个网站要是频繁访问都会被封IP,那要怎么解决这个问题呢?不可能一直频繁的更换设...

  • 使用python验证代理ip是否可用

    在使用爬虫爬取网络数据时,如果长时间对一个网站进行抓取时可能会遇到IP被封的情况,这种情况可以使用代理更换ip来突...

  • Scrapy使用代理爬取网站

    前言 在我们平时使用爬虫程序采集数据时,往往会遇到,因采集速度过快导致的自己网络ip被目标网站封禁,这种封禁有时候...

网友评论

本文标题:采集时被封ip的解决方法(上)

本文链接:https://www.haomeiwen.com/subject/pfkuhttx.html