美文网首页方式方法
采集时被封ip的解决方法(上)

采集时被封ip的解决方法(上)

作者: 四季变幻 | 来源:发表于2015-12-14 08:43 被阅读547次

    最近各种网站的采集程序写的比较多,遇到在采某网站时采到100多条时突然发现对方的网站打不开了,猜到肯定被封ip了,用了代理还是会封,这不是办法。在网上找了一些资料都没有找到,功夫不负有心人啊,在找的时侯有一个人提到了用搜索引擎爬虫蜘蛛的USERAGENT。虽然只提到一点点我还是想到了,列出我的解决方法,

    1.使用Snoopy或curl传搜索引擎爬虫的USERAGENT值。

    查看搜索引擎爬虫的USERAGENT值:http://www.geekso.com/spdier-useragent/

    2.使用Snoopy或curl传referer值。

    如:$snoopy->referer = 'http://www.google.com';

    $header[] = "Referer: http://www.google.com/";

    3.使用Snoopy或curl代理。

    如:$snoopy->proxy_host = "59.108.44.41";

    $snoopy->proxy_port = "3128";

    4.使用Snoopy或curl防造IP。

    如:$snoopy->rawheaders['X_FORWARDED_FOR'] = '127.0.0.1';

    $snoopy->rawheaders['CLIENT-IP'] = '127.0.0.1';

    5.用php写一个重起路由器的程序,这样就会获得新的ip地址。

    6.如果发现重起路由器还是显示被封,有可能对方封了你路由器的mac地址,现在路由器都有修改MAC的功能,可以写程序或手动修改路由器的MAC地址。

    原文:http://blog.kgula.com/ip-banned-solve-method/

    相关文章

      网友评论

      本文标题:采集时被封ip的解决方法(上)

      本文链接:https://www.haomeiwen.com/subject/pfkuhttx.html