美文网首页
对爬虫的宽容与约束

对爬虫的宽容与约束

作者: 小小 | 来源:发表于2017-05-17 14:18 被阅读20次

提到爬虫,对于行内人士来讲感情是复杂的。人人都在用,人人都在防。又有很多人给爬虫分类,初级的、中级的、高级的、善意的、恶意的。对待爬虫的态度也是迥异的,有人专门撰写文章批评、有人举例回击,但大多数人都在默默按自己的想法行动(爬或防)。

不得不承认,我也是一个爬虫作者。因为看多了,听多了,也想表达一下自己对爬虫的看法。我的态度是“请对爬虫多一些宽容,加一点约束”。

“诟病爬虫”的原因

个人见解:不喜欢或诟病爬虫的人,主要是被爬虫骚扰过或正在被骚扰的人或公司。爬虫只是一个技术工具,无关好坏。你诟病是使用爬虫的人。就像一把刀,有人用来切菜,有人用来杀人一个道理。

宽容

互联网本身就是因为宽容和共享而存在。因为宽容,成就了Google和百度,如果每个网站都禁止爬虫,你能想像互联网是什么样子吗?从另一个角度看,有爬虫光顾,说明你的网站还有价值,难道不是吗?就像矛和盾永远是对立的吗?他们是互相依赖的。正是因为有了爬虫,才产生了防爬技术,防爬技术也让爬虫技术飞速发展。同时,也不是防就是不宽容,防只是防新虫或害虫。我们对爬虫宽容,也要对网站宽容。

约束

宽容不是放纵,更不是无底线。我的观点是“约束爬虫、引导新虫、防治害虫”。约束既要公共约束,更要自律约束。特别是对于新虫,通过自律约束,不要发展成害虫。自律约束包括爬取速度设置要合理,爬取时间要合理,以不影响网站正确运营为底线。我相信,做大事的人,永远都会保留底线,遵守底线原则。通过长期的自律约束,我们自然就有了公共约束。约束爬虫,请从每一条虫子开始吧,我希望你尽快加入到爬虫约束队伍。

相关文章

  • 对爬虫的宽容与约束

    提到爬虫,对于行内人士来讲感情是复杂的。人人都在用,人人都在防。又有很多人给爬虫分类,初级的、中级的、高级的、善意...

  • 所谓成熟

    是对局面有掌控,对未来留余地, 是对他人有宽容,对自己有约束。

  • 你好,自己!

    我与自己的和解,是勇于对自己狠心,是敢于爱每个阶段的自己。拥有约束的欲望,享受自律的自由。对自己宽容,对生活积极,...

  • 2021-03-27

    论宽容 宽容是什么?宽容就是对那些曾伤害过自己的人,报以宽恕之心,宽容就是对他人的包容与善良 什么是宽容?在历...

  • 对昨日情绪失控的反思

    对局面有掌控, 对未来有余地, 对他人有宽容, 对自己有约束。 情商最高的人, 要的不是赢, 而是解决问题。 摘下...

  • 与人为善

    与人为善。 我们要的不是赢,而是解决问题。对局面有掌控,对未来有余地,对他人有宽容,对自己有约束。 与人...

  • 爬虫不尽兴?那再来点反爬虫吧!

    爬虫与反爬虫,这相爱相杀的一对,在现在你会爬虫是不够的,你还得会反爬虫。 为 Python 平反 首先是爬虫,爬虫...

  • 爬虫?反爬虫!

    爬虫与反爬虫,这相爱相杀的一对,在现在你会爬虫是不够的,你还得会反爬虫。 为 Python 平反 首先是爬虫,爬虫...

  • 爬虫:robots协议 -- 爬虫的道德约束

    摘要 robots协议全称是“网络爬虫排除标准”,它意在规范爬虫程序的行为。一个网站的robots协议就是在告诉爬...

  • scrapy框架-反爬虫与绕过方法+setting动态配置

    反爬虫与绕过方法 反爬虫的技术越来越丰富,种类也越来越多,以下归纳爬虫与反爬虫的应对措施和绕过方法。 甲.对网站感...

网友评论

      本文标题:对爬虫的宽容与约束

      本文链接:https://www.haomeiwen.com/subject/cviwtxtx.html