一、数据化(一切皆可“量化”)
大数据发展的核心动力来源于人类测量、记录和分析世界的渴望。信息技术变革随处可见,但是如今的信息技术变革重点在"T"上,而不是在“I”上。现在,我们是时候把聚光灯投向“I”,开始关注信息本身了。
马修莫里曾是一名美国海军军官,在一次意外中他大腿骨折,从此无法继续他的航海事业。幸运的是他在受伤后依旧被任命为图表和仪器厂的负责人。在这里,莫里发现,现在的航海图大多都会选择舍近求远只因为走过这些路的许多水手都觉得这条航线安全。而依据莫里多年的航海经验,他知道这是完全错误的。他发现海军依赖的图表有的都使用了上百年,其中很大部分都有遗漏和离谱的错误。当莫里有一天在整理仓库时候发现了历任海军上尉的航海日志,他惊喜得发现,他所需要的信息都在这日志里面。这本日志是许多上尉在无聊时候随意填写的,类似于日记本,里面甚至有许多无聊的涂鸦,但就是通过分析这些杂乱无章的信息,莫里将其有价值的信息归纳整理,呈现出了一张全新的航海图。为了提高精准度,莫里让之后的海军每次归来必须将航海日志上交。他正是通过一次次的数据收集,和计算处理,最终绘制了一张直到今天还能够使用的航海图表。而且这张图表帮助商人省下了一大笔钱,因为航海路程因此减少了三分之一。
庞大的数据库有着小数据库没有的价值,莫里中校是最早发现这一点的人之一。这说明远在信息数字化之前,对数据的运用就已经开始了。
数据化——是指一种把现象转变为制表分析的量化形式的过程。
数字化——指的是把模拟数据转化成用0和1来表示的二进制代码。
因此,技术专家都默认大数据的发展和计算机的变革是同步的。
记录信息的能力是原始社会和先进社会之间的分界线之一。计量和记录一起促成了数据的诞生,它们是数据化最早的根基。几百年来,计量从长度和重量不断扩展到面积、体积以及时间。大约公元1世纪的时候,印度发明了自己的一套数字系统,并将其传到波斯,而后传入阿拉伯国家并获得了极大的改进。而这正是阿拉伯数字的前身。在12世纪,介绍阿拉伯数据的书籍被翻译成拉丁语,开始传遍欧洲。
早在阿拉伯数字传到欧洲之前,计数板的使用已经改善了算术,但它勉强可以计算却无法用来记录。算术赋予了数据新的意义,因为它现在不但可以被记录还可以被分析和再利用。伴随着数据记录的发展,人类探索世界的想法一直在膨胀,我们渴望能更精准地记录时间、距离、地点、体积和重量。到了19世纪,随着新工具的发明测量,科学已经开始离不开量化了。新工具和开放思维促进了测量事物和记录数据的繁荣。数据化的基础已经奠定完好。计算机的出现带来了数字测量和存储设备,这使得通过数学分析挖掘出数据更大的价值变成了可能。简而言之,数字化带来了数据化,但是数字化无法取代数据化。
当文字变成数据,它就大显神通了——人可以用之来阅读,机器也可用之来分析。正如上一篇文章所说,谷歌通过扫描文本,将文字数字化,然后利用数据配对来选出最佳的翻译语句。而亚马逊也同样看到了这一领域,它不仅将图书转化为数字图像,还将数字图像转化为文本,使人们可以在Kindle上更改字体大小和用黑白彩色两种方式来看书。而亚马逊只是把重心放在阅读本身,而谷歌却触及了数据化内容的价值。
我们可曾想过,在最开始没有东西南北,没有经纬度的时候,我们是如何表达我们的地理位置的。古人云:“所谓伊人,在水一方。”这其实说明了,人和事物的地理定位自然是信息的组成部分。
在1884年,在美国华盛顿召开的国际子午线会议上,24个国家一致同意定下本初子午线和零度经线所穿过的地方。从此,地理定位信息终于能在标准化的数值范式下进行标记、记录、测量、分析了。但是,早期的地理接收装置非常昂贵,它适用于潜艇而不是出租车。而随着数字设备廉价芯片的普及和GPS的发展,使我们今天可以轻而易举得知道我们此时此刻已经想要知道的地方的坐标。
这样的发展,使得跟踪事物的地理位置变得十分容易。随着汽车装上了无线传感器,地理位置信息的数据化深刻变革了保险的概念。车主会根据他的实际驾驶地点和时间购买汽车保险,这改变了保险的基础,从考虑一个群体的平均风险转变为个性化的分析。
但位置数据在商业以外的用途或许才是最重要的。麻省理工学院媒体实验室人类动力学实验室主任亚历山大彭特兰,通过分析手机数据来得知每个人去了哪里、见了谁,成功地区分除了感染了流感的人群,而且这还是在感染者还不知道自己被感染的情况下。
总之,位置信息一被数据化,新的用途就犹如雨后春笋般涌现出来,而新价值也会随之不断催生。
数据化的另一个前沿更加人性化,直接触摸到了我们的关系、经历,情感。我们都知道,在Facebook中有一项可能认识的人,这便是通过分析我们的位置,我们的社交网络,甚至我们日常中许多意想不到的元素,从而得出每个属于我们个人的“社交图谱”。
数据化不仅能将态度和情绪转变为一种可分析的形式,也可能转化人类的行为。就像宾夕法尼亚州立大学的一名生物学家那样,他通过分析人群中twitter的状态来得出他们的个人卫生行为,从而更易发现未接种疫苗的人群在哪。
只要一点想象,万千事物就能转化为数据形式,并一直给我们带来惊喜。有了大数据的帮助,我们不会再将世界看作是一连串我们认为或是自然或是社会现象的事件,我们会意识到本质上世界是由信息构成的。将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。
价值二、价值(“取之不尽,用之不竭”的数据创新)
数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,而绝大部分都隐藏在表面之下。
事实上,数据通常都是为了某一个特定的目的而被收集的,数据的基本用途为信息的收集和处理提供了依据。
不同于物质性的东西,数据的价值不会随着它的使用而减少,而是可以不断地被处理。就如同经济学家说的那般:个人的使用不会妨碍其他人使用,而且信息不会像其他物质产品一样随着使用而有所耗损。
数据的价值并不仅限于特定的用途,它可以为了同一目的而被多次使用,也可以用于其他目的。要了解大数据时代究竟有多少信息对我们有价值,后面这一点尤其重要。
要将所有数据价值的冰山融化,就必须通过新一代统计人员的不懈努力并借助新一代的方法和工具。最终,数据的价值是其所有可能用途的总和。这些选择的总和就是数据的价值,即数据的“潜在价值”。
以下为六种数据创新:
①数据的再利用。益佰利旗下的公司Hitwise通过收集搜索流量数据来揭示消费者的喜好,并可供政府部门制定下一步的政策,也让旅游公司通过了解人们的兴趣点来对症下药。
②重组数据。丹麦癌症协会记录了大约358403名手机用户和10729名中枢神经系统肿瘤患者的信息。研究人员通过研究两者间的关系,来探究手机是否会引发癌症。最后,研究结论得出使用手机与癌症之间不存在任何关系,但是这些数据的一开始收集也并不是为了这项课题,但却仍然能被利用作为其他课题的样本。随着大数据的出现,数据的总和比部分更有价值。
③可扩展数据。有些商店可以利用监控摄像来知道顾客喜欢哪一类商品从而对其进行进购促销,而在之前,监控摄像仅仅只是作为监控扒手小偷的工具,现在却被视为一项可以增加收入的投资。
④数据的折旧值。即使数据用于基本用途的价值会减少,但潜在价值却依然强大。
⑤数据废气。数据废气是许多电脑化服务背后的机制,如语音识别、垃圾邮箱过滤、翻译等。当用户指出语音识别程序误解了他们的意思时候,他们实际上有效地“训练”了这个系统。
⑥开放数据。由于政府在获取数据中所处的特殊地位,他们在数据的使用上往往效率很低。因此,“开放政府数据”拥有越来越多的支持者,他们希望政府可以公布民用和商业数据来帮助商业的进一步发展。
公司账面价值和市场价值之间的差额被记为“无形资产”。在大数据时代,数据成为这无形资产的主体部分。也因为这是新时代下的产物,导致传统的审计方式无法用于这类资产的计算,造成了许多估值与计算价值之间的巨大差距。
那么,我们应该如何给数据估值?
一个办法是从数据持有人在价值提取上所采取的不同策略入手,最常见的一种可能性就是将数据授权给第三方。然而,由于被许可人可能无法提取数据全部的潜在价值,因此数据持有人可能还会向其他方授权使用数据,这将间接评测出数据的价值。
角色定位三、角色定位(数据、技术与思维的三足鼎立)
如今,我们正处于大数据时代的早期,思维和技术是最有价值的,但是最终大部分的价值还是必须从数据本身中挖掘。
真正能使得公司取得成功得是他们拥有大数据的思维观念。
大数据价值链的三大构成:
一是基于数据本身的公司。这些公司把自己放在了这个信息链的核心,这样它们就能扩大规模、挖掘数据的价值。他们将通过数据来给予顾客更好的服务,同时顾客也会因此还给他们更多的数据,而他们在用完这些数据之后卖掉还可以再争取一部分利润。
二是基于技能的公司。这类公司通过受理分析数据拥有者授权给他的数据来进行分析并做出最完善的判断,他们经常受到高度的赞扬,同时被封为“数据武士“这样的时髦名字,但是他们在大数据中淘金,发现了金银珠宝却要把这些财富拱手交回。
三是基于思维的公司。这类公司大多是外行人,因此他们的思维可以不受限制。他们思考的只有可能,而没有可行。
所谓大数据思维,是指一种意识,认为公开的数据一旦处理得当就能为千百万人急需解决的问题提供答案。如今的大数据先驱者们通常都有着交叉学科的背景。大数据就可以变革公司的盈利模式和传统交流模式。
全新的数据中间商。这应该是那些拥有大数据思维或者说创新性思维的人。如今我们正处于大数据时代的早期,思维和技能是最有价值的,但是最终,大部分的价值还是必须从数据本身挖掘。
大数据公司的多样性表明了数据价值的转移,随着数据价值转移到数据拥有者手上,传统的商业模式也被颠覆了。
如今,行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。他们的判断建立在相关关系的基础上,没有受到偏见和成见的影响。
在新闻界,数据比有经验的记者更能揭示出哪些是符合大众口味的新闻。这意味着,与时俱进才是职业领域取得成功得必备技能,专业技能就像精确性一样,只适用于“小数据”时代。作为外行人,他们不会被行业内的争论所限制,因为他们不会被自己所支持一方的观点所影响而产生偏见。数学和统计学知识,甚至是有少许编程和网络科学的知识将会成为现代工厂的基础。不只是专业技能的深度很重要,大数据的广度也变得很重要。
人们往往通过经验来判断事物,如同奥登的名诗中所说:“知识退化成骚乱的主观臆想,那是太阳神经丛的感情引起的营养不足。”
大数据将决定着企业的竞争力。大公司和小公司都可能成为赢家,而大部分中等规模的公司,要么向两端转换,要么破产。因为这些中等公司,没有大公司挖掘数据的能力,也没有小公司灵活的数据思维,他们在这场与时俱进的战争中,将难以获胜。所以,一旦一个公司掌握了大数据,它不但有可能超过它的多少,还有可能遥遥领先。
但是,我们的认知和制度都还不习惯这样一个数据充裕的时代。
Next.
网友评论