美文网首页
数据是现实世界被采集到的赛博痕迹

数据是现实世界被采集到的赛博痕迹

作者: 清水舍 | 来源:发表于2022-07-02 16:10 被阅读0次

“Data is the new oil”

--这是2006年就响彻世界的一句口号,早在我们绝大多数人感知到数字产品带来的颠覆性变化之前,早早地就有人认识到数据的价值,并尝试应用变现。

将数据比做石油,一方面确实映射了其巨大价值,以及需要被提取和处理才能被使用的性质;但另一方面,不得不说仍然是工业时代思维的理解,而忽略了其本质:

数据,是人类在物理世界上的行为,留在数字世界里的痕迹。

数据映射的概念与应用(数字孪生、大数据、AI...)

是痕迹,而非复制体。

因为在可预见的未来里,人类尚不可能理解所有的物理规则,自然不可能构建一个复制物理世界的数字空间。

我们只是通过理清数据之间的逻辑关系/相关关系,以从数字世界的痕迹反向推理复原出物理世界中发生的事件。

最为典型的概念就是“数字孪生(Digital Twin)”:

数字孪生是一个虚拟模型,用于准确地反映物理对象。

例如为风力涡轮配备各种与重要功能领域相关的传感器。 这些传感器产生与涡轮不同方面性能相关的数据,如能量输出、温度、天气条件等等。 然后,这些数据将转发到处理系统并应用于数字副本。 

获得这类数据后,虚拟模型就可以用来运行模拟,研究性能问题和探索改进的方向,最终目的是产生洞察 - 而洞察又可以反过来应用于涡轮的设计。

所以上一节总结所说的,「受数据牵引的数字化协作模式」就是将数据看作人类社会活动留下的痕迹,用痕迹去指导物理世界中人类的行为,就好比让你踩着别人留好的脚印向前行走。

是的,数据不仅能映射物理层面的行为,也可以映射社会层面的意识。

但人类社会性行为间的关系,在数字世界里的映射关系还非常模糊。

所以当前的“大数据”技术,只能从趋同或趋反的数据表现里,找到代表相关关系的数据变量;而大家在网上看到的许多洞察,其实是人类根据逻辑判断阐述的结果。

比如大家耳熟能详的例子:

全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。

这个例子里,男性、购物、啤酒、尿布可能是呈现出相关关系的数据,然而他们之间的逻辑关系却并不是大数据技术告诉你的,而是你结合生活经验猜测的。

识别这样的逻辑关系其实非常考验人类对业务的理解能力,甚至缺乏解释的结论,可能因为谬误、伦理问题而不敢被应用,比如“xx星座的人犯罪人数高”这个结论,可能是因为忽略了xx星座出生人数最多这个关键因素。

那么如果不经过人工逻辑的处理,而直接对数据相关关系进行应用,就是AI技术的来源。

我们暂且抛开技术实现层面的讨论,从输入和输出上去理解:AI就是使用大量的数据,训练算法,找到数据间的相关性,并在相对单一的、人类设置的目标和规则中对新数据的结果进行反馈。

比如ai美颜功能,就是将大批量被认为符合某种审美的照片作为数据,再将你的照片与之对齐。它的目标是符合大众审美,规则是大众审美。

所以AI技术面临的伦理问题会更多,如果数据来源有偏见,ai反馈的结果相应就会有问题,比如中国的ai美颜软件会把外国人p得更像亚洲人,美国的ai修图软件会把人还原得更具有白人特点。

又比如在几年前美国发生的一场大规模枪击案里,由于大量逃离人群通过Uber软件同时叫车,其AI算法直接大幅提高出租车价格,导致Uber被大量投诉。为消除此事的影响,Uber宣布以后每次调整价格,都会由人工介入做最终决策。

当然,这里并不需要过于深入的去探索技术细节,只需要理解技术原理和其应用的限制,就能帮我们更好地处理问题。

这里总结了应用数据映射相关的技术时,需要关注的三个问题:

1、数据采集是否真实、全面?

2、数据洞察是否可信?

3、数据预测的有效条件是否满足?

相关文章

网友评论

      本文标题:数据是现实世界被采集到的赛博痕迹

      本文链接:https://www.haomeiwen.com/subject/ntdkbrtx.html