美文网首页
什么?连蟑螂都忍不了的我,还在忍恶意爬虫?

什么?连蟑螂都忍不了的我,还在忍恶意爬虫?

作者: 十不遗 | 来源:发表于2018-08-16 16:42 被阅读333次

    【本文由赞我(zaneds.com)独家冠名】

    前言:

    近日,“人民日报评论”上发表了一篇名为“互联网上的脚印,竟然是爬虫留下的?”的原创文章。文章中指出当爬虫技术越界、与利益相勾连时,我们该如何防止个人数据窃取、隐私贩卖?

    文章并没有给出一个答案,但提出了一个发人深省的问题,“当前堵截互联网上密密麻麻、行踪诡谲的恶意爬虫,如果只是依靠‘魔高一尺、道高一丈’的技术竞速(爬虫与反爬虫技术),又何时是个尽头。”

    难道蟑螂都忍受不了的我,还要继续忍受恶意爬虫吗?Oh,NO!


    一、爬虫是什么?

    百度人称,“网络爬虫(又被称为网页蜘蛛,网络机器人),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。”

    爬虫

    简单来说,它就是一种“自动化浏览网络”的程序。想想孙悟空可以拔根猴毛变出一大群猴子猴孙替他群殴,程序员也可以通过编程制造出成千上万的隐形爬虫,穿梭在互联网空间中,改编农夫山泉的广告词描述就是,“我们不生产信息,我们只是信息的搬运工。”不知疲倦、生生不息。


    二、爬虫也有好坏

    虽然我不知道蟑螂有没有好坏,但还是知道爬虫有好坏的。

    生活中,我们最常用到爬虫技术的就是在搜索引擎上,互联网时代信息的极大爆炸,使得我们单靠个人之力想要搜索到想要的信息,成本和难度都是极大的。而有了爬虫群体的无时无刻、任劳任怨地辛勤劳动,才给我们带来了更快更精准的搜索结果。后来,爬虫所爬领域越来越广,从电商、社交到经济、金融,能力也越来越强。想象一下,孙悟空和他的猴子猴孙们从刚开始纯粹的群殴团伙,不断升级为专业的战斗团队,各个国家都想花重金聘用他们了。同样,随着爬虫技术越来越强大,金钱的触角也伸向了爬虫技术。“一篇报道就曾经解密数据公司,是如何利用爬虫获取用户在社交软件上的行为轨迹,进而绘制出完整的用户画像,进行隐私贩卖。”

    我们生产了数据,但却没能为它加把锁,“在大多数的公司和机构眼中,你就是一堆数据——这些数据来自你在互联网上的活动踪迹。 它们收集你的数据并将其变为一个虚拟的你。”

    用户画像

    三、区块链为数据加把锁

    可能你会问区块链是什么呢?简单来说,区块链就是一种点对点传输、去中心化的开放分布式账本。那么它怎么保护我们的数据呢?

    区块链锁

    ·确定所有权

    我们可以掌控自己的身份和个人数据。想想现在有一个人在网上卖衣服,没有入驻任何平台,那你敢买他的衣服吗?你这边刚把钱打过去,那边他就收了钱下线走人了,茫茫网海,你找谁啊。所以你选择在淘宝上买衣服,卖家能跑,淘宝可跑不了。这时你将信任交予了淘宝。但是淘宝也怕卖家跑了啊,所以它也必须将卖家的信息全部了解清楚。之后你们愉快地在淘宝上交易,淘宝也就自然知道你买了什么、偏好是什么、购买力怎么样等等信息。

    这个例子就说明了中心化机构为什么能掌握你的信息,因为在你不能信任交易对象时,你就只能信任权威的第三方,而相应的“浮士德契约”就是:你的基本信息、所作所为都在第三方的数据库中,而你也无法预料他们会对你的数据做些什么。

    而区块链本质是建立去中心化的信任机制,作为一种底层技术,它可以构建一种纯粹的点对点的价值转移体系, 在不需要各节点互信的情况下,区块链可以保证系统内数据记录的完整性和安全性,可以脱离第三方机构背书, 有效地降低交易的复杂性和风险。至此,我们无需第三方作为我们的见证人,也就不需要把我们的信息无私奉献给他们,从源头保障数据掌握在自己手中。

    去中心化

    ·掌握使用权

    想想你新下载一个手机APP,它做的第一件事就是获得你的授权,权限包括位置、手机联系人、拨打电话、相机、读取通话记录、修改通话记录等等,我就想不通了,你一个修图的APP干嘛要修改我通话记录……

    在交易活动中,区块链会根据具体的情况向对方公布必需的细节或金额, 同时妥善地处理在网络活动中所产生的各种遗留信息,以保护你的隐私权。比如我看重了你的衣服,那我给你的钱包转账,提供收货地址即可,而不用把我的信息全部让你知道,你所了解到的“我”只是个区块链上的节点,购买完你的衣服后,我可以又选择消失在茫茫链海……

    ·享有收益权

    在区块链上,我们可以使用自己的信息谋求自身利益。 因为我们掌握了自身的所有数据,那么公司需要我们的某些数据做营销支持分析的时候,我们可以选择公开特定的数据,而且对方必须支付一定的报酬。


    四、结语

    互联网社会中,我们浏览之所及,都留下了我们的相应数据,但我们对此是无知无觉的,而且也无能为力。爬虫的使命就是搜索收集信息数据,就像大地上洒满了米粒,你不能阻止蚂蚁搬运。当有人利用爬虫技术来搜集数据并用于攫取财富的时候,我们用恶意爬虫表达我们的厌恶。但其实技术本身其实无天然的好坏,毕竟不是爬虫让你的信息泄露,而是它本来就散落在地上,刚好爬虫把它捡起来了而已。

    而区块链技术所做的,就是不让我们的米粒掉在地上,谁想要我们的米粒,就必须经过我们的同意,并支付相应的报酬。可能你会问,那时爬虫还是存在吗?我想说,爬虫依然存在,但它不再以我们的数据隐私为食。

    dream

    相关文章

      网友评论

          本文标题:什么?连蟑螂都忍不了的我,还在忍恶意爬虫?

          本文链接:https://www.haomeiwen.com/subject/qpsobftx.html