美文网首页进击的PM@IT·互联网今日看点
到今天我才读懂大数据 |《智能时代》有感

到今天我才读懂大数据 |《智能时代》有感

作者: 木子_姑娘 | 来源:发表于2017-03-05 18:48 被阅读486次

    记得从14年开始,网络、新闻、媒体就开始大肆的宣传大数据,然而铺天盖地的概念热潮,却也只是让我知道:
    嗯,现在流行大数据,抓住大数据就可以获得财富!

    可什么是大数据?为什么大数据可以创造财富?如何利用大数据创造财富?我却是一问三不知。

    知其然却不知其所以然,只浮于表面却经不起深度的推敲;这种假象的“富有学识”带来的空虚,让我决定好好的静心学习一番,便有了这次吴军《智能时代》的研读。


    1 大数据是什么

    1.1 数据的本质

    想要了解“大数据”,就必须对“数据”本身有个基础的认识。人类自诞生文明以来,数据就具有了不可替代的作用,它承载信息、传达信息,但其本身却不会对信息有任何的加工和利用。反之,人类根据数据所承载的信息,自我汇总和挖掘后形成抽象的信息;并对信息进一步的整合和处理,最后形成了系统性的知识。
    也就是说:

    信息是:人类对世界、人和物的描述
    数据是:信息的载体,客观存在
    知识是:信息的整合和处理,具有系统性。

    1.2 大数据的本质

    既然数据是人类存储抽象信息和知识的载体,那大数据是否就是“数据”在“量”上的积累?

    说实话,在阅读《智能时代》之前,我对“大数据”的概念也就停留在这个地方,可事实却是:只有量的积累的数据,通常并不能称之为大数据。比如,将全国所有人的出生年月收集起来,满足了“量”的特性,可这个数据除了能清楚人口社会统计学特征外,又能用什么用呢?

    大数据一般具有三个特点:大量性、多维度、全面性

    吴军针对大数据,给我们做了一个较为全面的定义,除了大量性,大数据常常还应该具有多维性和完备性。

    大数据的多维性,可以理解为针对单一“个体”(人/物/事件等)不同角度的数据。比如之前提到的:收集全国所有人的出生年月,单收集这一项,数据单一缺乏意义;但如果再加入收入、所属地区、受教育程度等等多维的信息,那数据本身就变得鲜活了。我们可以从数据中分析人口的地域分布、经济分布、教育分布等并在此基础上给出宏观的资源调控计划。

    大数据的完备性,则可以理解为数据的全面性。比如2012年一位名叫内德·斯威尔的年轻人,利用大数据成功预测了美国50+1个州的大选结果。他其实就是在投票前利用互联网尽可能的搜集当年的大选数据(如地方媒体数据、社交网络留言、朋友间评论等),从而近似的知道每个人对大选的态度,并按照州进行分类整理,最终成功预测了当年的大选结果。

    缺少多维性的“大数据”会让数据承载的信息“片面”,进而导致数据本身的利用价值大大下降;缺乏完备性的数据则会由于缺乏“完备样本”的支撑,也会使得获取的信息“局限性”。
    此外,吴军指出:

    大数据最好还应具有“及时性”,但及时性却并不是其必备条件,只是有了“及时性”的大数据,会实现一些过去无法做到的事情。

    大数据的及时性,可以理解为数据收集的时效性。一方面,要分析当前情况,就要尽可能使用与当前时间点较为接近的数据;另一方面,数据本身就在时刻产生(特别是今天的互联网),新鲜的数据能更快速的反应当前社会的一些情况。比如使用百度地图导航的时候,它能根据数据库中人们当前的(及时的数据)车辆出行地点,和即将要去的地方大概估算出此人的行程规划,并通过众多数据的整合估算出某一路段可能的堵塞情况,进而在导航的时候给出“避免拥堵”的导航建议。

    由此可见,所谓的大数据,一定要同时满足大量、多维和完备(相对来说)的特点,并在此基础上,最好具有“时效性”。

    2.大数据为什么可以创造财富

    媒体、创业者、企业家们都在追逐大数据,并坚信大数据可以创造财富。可按照大数据本身的特征来看:它一直都是客观存在的;那为何直至今日,大数据才得到热捧,并给人们带来巨大的财富价值呢?这可能要从人类思维模式的转变说起。

    2.1传统机械思维

    《智能时代》将人类思维的演变划分为了早起的“机械思维”和现在大数据时代的“大数据思维”(也叫信息论)。并将机械思维定义为:

    认为世界的变化是有规律可循的
    确定的规律可以被人类认知并用简单的语言或公式进行描述
    这些规律应该具有普适性,即便在未知领域也应该适用

    简单的来说,机械思维就是相信世界是具有确定性的,而人们可以利用因果关系发现这些确定性的规律,同时新发现的规律也可以应用到一些未知的领域。

    早期的欧几里得(著作《几何公理》)、托斯密、牛顿等科学家们就是利用这种“确定性+因果关系”的“机械思维”推动了人类在科学领域和工业领域的进展。

    “通过观察事物获得模型或者提出假设,并在此基础上进行试验和数据验证,最后得到结论或者是修正后的模型”这是现如今科研人士常用的“科学的研究方法”;甚至于企业家们在做市场调查时,也会利用这种提出假设、收集数据、验证假设的模式进行市场调研。

    这种强调“确定性假设”和“因果逻辑求证”的思维,从少数样本归纳总结出规律,再推广使用到整体,在最初确实给人们社会带来了巨大的进步;然而随着表面“确定性规律”的探索逐步完善,人们越来越难以发现哪些隐藏再在深处的“确定性规律”,“创新”永远是一个难以把控的难题。机械性思维带来的科学进展速度越来越慢。

    2.2大数据思维

    在机械性思维主导下的科学研究速度越来越慢的同时,互联网诞生了。网络的诞生给世界带来了大量的数据积累和信息流通,并带来了一次“大数据思维”的思想变革。

    机械思维时代,由于数据收集的局限性,科学家们只能在有限的样本下“大胆假设小心求证”,然而受限于人类大脑的“创造力”,所谓的“大胆假设”也并不是真的“大胆”;随着互联网时代的到来,“数据”不再成为问题,当大量数据堆积在一起时,就产生了“质”的变化。

    互联网时代的人们逐渐发现:** 世界其实是不确定的**,一方面世界的本质就是不确定的(比如原子核中的电子时刻都在做着无规则的运动);另一方面影响世界本身的变量太多,我们没办法用简单的公式将他们全部囊括进来,只能尽可能的利用随机事件来处理,利用概率来解释。

    与此同时,伴随着数据的大量积累和统计数学的发展,人们惊喜的发现:在数据量达到一定程度的时候,数据和数据之间的关联可以反映出某些意想不到的结果。于是大数据思维就诞生了:

    世界本身是不确定的
    利用大数据可以尽可能的消除这种不确定性
    因果关系可以利用数据间的相关关系进行代替

    大数据思维,也有人将其成为“信息论”,其本质就是:1)利用不确定性看待世界,然后利用大数据来尽可能的消除这种不确定性;2)利用具有多维度特征的大数据,数据之间的相关关系来代替机械思维时代的因果关系,帮助我们在“创造”难以掌控的情况下,发现意想不到的结论。

    举例来说,我们在投放广告时,机械思维要我们先有一个假设:目标人群可能的特征,并进行调研和证实;而大数据思维则是:我们不确定要投放给什么样的人群,紧接着我们利用已有用户的数据特征发现了“用户群体画像”这就是消除不确定性的过程,最终我们直接根据数据给出的结论来制定计划。

    另外,我们利用机械思维制定投放广告的策略时,会按照严谨的:“提出假设——实验验证——得出结论”的逻辑关系制定;但在大数据思维下,我们不需要知道“为什么具有A特征的用户应该是我们投放广告的目标人群”或“为什么C平台应该是我们选择的投放渠道”,我们只需知道,“数据显示A类人群购买此类产品最多”或“不同平台中C类平台的广告产出比最高”仅此而已。这就是用“数据的相关性”取代“因果关系”。

    2.3 大数据思维创造财富

    很多时候落后与现今的差别不是购买机器或者引进技术能够弥补的,落后最可怕的地方时思维方式的落后——吴军《智能时代》

    我用吴军在书中的这句话来回答“大数据为什么可以创造财富?”,正如吴军所说,很多时候决定落后与先进的关键就在于:思维。

    大数据思维让人们摆脱了“创造力”的限制,可以在没有“确定假设”的前提下,大胆的挖掘数据信息,进而得到意想不到的结果;大数据思维也让人们摆脱了“因果逻辑”的限制,可以在不知道“为什么”的情况下利用“相关性”推断出可能的结论。从这两个角度来看,大数据思维扩宽了人们对世界的认识,也加速了人们探索世界发现结论的过程。

    另外,大数据本身“来源于细节,汇总成整体;再从整体推演,应用到个体”的双向数据流通模式,也让大数据可以做到“取之于民,用之于民”,进而使得数据的价值得到挖掘和应用。比如google利用大数据的“穷举法”(google数亿计的用户帮助穷举)完善其检索的智能性,并利用优化后的检索更好的为每一位google用户服务。

    3.怎么利用大数据创造财富

    大数据如此火爆,是否只有投入到大数据的研发中才能获得相应的财富呢?事实却并非如此,对比第二次工业革命,从其中获利的并不仅仅是工业革命的前驱研发者们,还有那群善于将新技术应用到原有产业的人。

    自工业革命起,人们就发现:新技术+原有产业==新产业”,比如,瓦特发明蒸汽机后,蒸汽机也被应用到了纺织业、制造业,从而改良了生产资料的制造和产出;摩尔提出摩尔定律后,原有的计算机硬件制造产业又催生出了软件服务业,摩尔定理也被应用到国民经济等其他行业;同理,大数据思维+原有产业==新的产业,而新的产业也能带来新的财富。

    大数据+传统家电行业,可以通过在家电终端接入数据记录和传输技术,延长家电供应商/销售商与顾客的交流时间,从而利用收集的数据更好的为顾客提供后续的服务或改进产品。如GE家电部门通过在冰箱上安置wifi和数据感应技术,获取用户使用冰箱的时间、频率、程度等,并通过分析数据个性化的推送后续服务和产品。

    大数据+农业,在农业种植的每一颗职植物上安置传感器,实时监控植物的生长状况,并根据这些数据个性化的配备营养;同时新收集的数据也可以作为已有数据的二次迭代,不断优化现有模型,从而实现农业培育的精准化。如严重缺水的以色列人就利用大数据监控模式和计算机自动化控制的滴灌技术实现了全国40%的农业出口(2007年数据)。

    大数据+医疗,利用医疗大数据帮助机器实现大量的个案学习,并在此基础上辅助医生快速的诊断病例;另外也可以利用计算机帮助分析现有癌症的排列组合以及对应药品疗效的排列组合,从而帮助医生在癌症领域快速的识别病变现状和就诊方案。如2012年google科学比赛的第一名就是利用760万份乳腺癌患者的病例数据创造了“计算乳腺癌细胞位置的算法”,从而帮助医生对病人进行活体检查,准确率高达96%。

    大数据的商业应用还有许多,只要留心人类的需求,就能发现对应的商业机会。因为尽管大数据带来了产业的升级,但人类的基本需求却没有改变,只是在采用新技术后,新的产业替代旧的产业来更好的满足人们的需求。

    4.技术发展的两面性

    最后,任何事物的发展都有两面性;回顾工业革命可以发现,人们一方面享受了工业革命带来的快速增加的财富,另一方面也要忍受工业革命带来的大量劳工失业、环境污染等问题。大数据带来的新的变革也同样会为我们带来两面性的影响。

    从好的方面来看,我们享受大数据在宏观方面给我们带来的便利:帮助预测城市交通拥堵情况、帮助维护城市治安、帮助警察识别反恐等等;也享受大数据在微观方面给我们带来的优良体验:产品的个性化定制、越来越智能的计算机、优良的用户体验、区块链辅助下的便捷信息沟通等等。

    但从不好的方面来看,我们也会担心大数据带来的社会性问题:隐私问题、失业问题、财富极端化问题、被无形控制问题、数据安全问题等等。
    但这些是技术发展所带来的不可避免的负面影响,我们能做的就是尽可能的减弱这种影响。

    吴军在《智能时代》的最后提到:制约权力最好的办法就是使用权利,解决一种技术带来的漏洞最好的办法就是采取另一种技术,那么保护隐私最好的办法或许就是让侵犯隐私的人必须以自己的隐私来做交换

    技术本无罪,关键是人们的使用方法;但现实却是贪婪是人类的本性,在没有制约的时候,人类很难做到真正的克制自我;或许在大数据带来的安全和隐私问题方面只能通过“技术管制技术,隐私换取隐私”的方式来保障个人权益了。


    这是Q喵每周一本书计划的第9周,很庆幸在较早的时间遇到了《智能时代》这本书,现如今互联网发展的太快,各种概念和热点更是漫天飞舞,可作为一个生活在这个时代的我们,除了这些表面的概念外又能对“这个时代”有多少的认知呢?

    抛开浮躁的社会,静静的自我研读,只有当我们自己发现:“哦原来现在是这样的时代时”,才能真正感触到“时代的变化”吧。

    Q喵读书,与君共勉

    相关文章

      网友评论

        本文标题:到今天我才读懂大数据 |《智能时代》有感

        本文链接:https://www.haomeiwen.com/subject/mexegttx.html