“大数据”的背后

作者: 司风惜语 | 来源:发表于2014-07-13 21:17 被阅读371次

          《大数据时代——生活、工作与思维的大变革》一书由[英]维克托•迈尔—舍恩伯格、肯尼思•库克耶著,中国的盛杨燕和周涛译,浙江人民出版社于2013年1月出版,截止2014年6月2日,该书在亚马逊上累计获得评论1440次,综合得分4.4星,豆瓣网上5683人评价,得分7.6.总体来看,本书反响很不错,作为译著4个月内历经5次印刷(笔者买到此书时印次为2013年4月第5次印刷),能受到国人如此多的关注,说明评论此书某种层面上还是有意义的,毕竟在出版泛滥的当下,有些书根本不值得为其专门写作书评,充其量也仅为短评。

             本书的副标题为“生活、工作与思维的大变革”,根据物质决定意识,意识反作用于物质的一般哲学原理,可以清晰的知道一切变革均建立在已有的物质基础之上,生活、工作与思维发生大变革皆取决于我们正身处大数据之时代,本书正是在此背景之下展开论述的。全书分三部分分而论之:思维变革、商业变革以及管理变革。其中思维变革是其他两部分变革之基调所在,作者强调:由于我们正处于大数据的包围之中,为此对待数据应遵循三个基本原则:1.不是随机样本,而是全体数据;2.不是精确性,而是混杂性;3.不是因果关系,而是相关关系。在商业变革及管理变革部分则以例证的方式进行论证,书中包含有丰富的能够证明作者观点的事例,如第133页提到的“IBM,电动汽车动力与电力供应系统优化预测”、第141页的“谷歌街景与GPS采集”、第144页-第145页的“微软与谷歌的拼写检查”、第151页的“FlyOnTime 的航班时间预测”等等,以上所举实例均在证明此观点:大数据在商业中的应用价值潜力非常之大。然而物极必反,凡事过了平衡点,必会有负面影响的出现,紧接着作者提出了“大数据时代的管理变革”之命题,认为“让数据主宰一切的隐忧”则是不可忽视的个体隐私侵害代价;进而随之而来的问题则是相关领域的管理变革。以书中所举的个体隐私保护为例,先前的隐私保护模式为“让人们自主决定是否、如何以及经由谁来处理他们的信息,把这种控制权放在了人们手中”(书中第220页),即“告知与许可”模式;然而在大数据时代,因数据的价值很大一部分体现在二次利用之上,“告知与许可”模式所能起到的隐私保护作用微乎其微,因此需要设立一个不同于先前的隐私保护模式。最后作者以对大数据时代的美好憧憬结束全文,认为尽管是大数据时代,人类的作用依然无法被取代,未来一切的美好等着人类去探索。

              毋庸置疑,人类早已进入了信息社会,大数据时代的到来是信息社会发展的必然结果。本书被媒体宣称为“迄今为止最好的一部大数据专著”,媒体如此宣称之原因更多层面的出发点可能应是:作者维克托•迈尔—舍恩伯格是最早洞察大数据时代之人,而非本书对于大数据的认识到位,兹认为源于本文前述的作者认为对待数据应遵循的三个基本原则,理由如下:1.针对“不是随机样本,而是全体数据”而言:在无论身处何种时代,人类永远处于永恒发展的动态运动之中的前提之下,作者所认为的以“全体数据进行预测而非随机样本”并不具有实际可操作性。第一,技术的发展永远赶不上人类每分每秒、随时随地产生的海量数据,更何况技术的发展本质上具有周期性;第二,“全体数据”的概念仅在相对情况下适合使用,此时静止期的数据样本在先进算法系统之下才明显优于先前人类所采用的随机样本;第三,即使是静止期的全体数据,其自身也具有局限性,只能代表过去,事实上根本不存在实际的“全体数据”。2.针对“不是精确性,而是混杂性”而言:自古至今,事物的发展变化本质上就是复杂多样的。按作者的逻辑,人类在大数据时代出现之前所收集的数据均是精确性的,然我们知道,在统计学中是允许一定误差出现的,即使在获取了全部样本之后,因各种原因也可能导致误差、不精确性的出现,因为世上本无完美之物。作者在此强调“不是精确性,而是混杂性”有些强说新辞之嫌。3.针对“不是因果关系,而是相关关系”而言:这是笔者最不认同之处:事物之间因果关系的探寻一直被认为是解决所有事情的根本出发点,作者得出此结论的逻辑是:由于海量数据的存在,使得事物之间显现更多的是相关关系,以致因果关系不易被人类所探寻,我们可以改变之前的固有观念,更多着眼于事物的相关性之上,放弃费力而不一定有结果的因果关系之探寻。事物的复杂性导致现实中表现出更多的现象,人类要做的应是去粗取精、由表及里,从现象中发现事物本质之所在,探寻规律,将规律应用于日常生活之中,而非放弃事物的本质探索。再者,在统计学和经济学领域,相关性分析本身就是存在着的,而且是作为重要的学科方法而存在;人类早在大数据时代到来之前,已认识到了事物间的相关关系的存在。大数据时代来临,只不过是将相关关系更凸显而已,而非作者的绝对否定。

             作为一本开大数据先河之作,本书更多的仅是说明了大数据是什么(What)介绍了相关应用事例,并未详细涉及如何获得大数据(Get)、获取之后如何进行分析大数据(Analyse)及如何具体的操作应用(Apply)。理想意义之上的大数据著作应包括该四个方面:W-G-A-A.但从价值理念传播意义层面讲,本书的价值是非常值得肯定的,那就是大数据时代已经来临,每个个体均是大数据的生产者、利用者及被利用者,大数据的价值潜力随着科技进步必将大放异彩,产生更加精准的预测;但随之而来的风险也不能忽视,信息领域的公开问题、隐私的保护模式等等,相关领域应做好准备迎接挑战。以近期我国开展的“扫黄打非”运动为例,被广大网友熟知的视频播放器软件公司快播因涉嫌传播淫秽色情信息而面临2.6亿元的巨额罚款,注册该网站的用户观影记录均被存储在云端服务器之上,若将大数据算法等相关技术运用于此,恐怕用户观看的色情网站名称、观看影片、观看次数等个人敏感信息均可定位搜索出。谁有权使用该相关数据?该相关数据是否属于用户隐私?即使对用户行为所产生的数据不进行预测,但被利用、调用的风险可能性依然存在。

             “大数据”背后更多的是如何应用大数据以及应用后随之产生的一系列问题的解决。

    相关文章

      网友评论

        本文标题:“大数据”的背后

        本文链接:https://www.haomeiwen.com/subject/qcqstttx.html