碎碎念
大三下学期开学至今两个多月以来对我本人来说意义非凡,几乎是一开学就感觉到了前所未有的压力,关于升学或者就业。我希望考研,其中一个原因是没有做本科毕业就业的打算,再一个原因是不希望在纯粹通信领域学下去了,想做些和计算机科学相关的东西(难听点就是去当码农)。凭心而论,本科学了通信并不是毫无用处,至少能从大的架构上去了解现代信息行业是怎么去运转的。但本人实在耐不住寂寞去修信息公路,一心想转行去操控公路上车辆行驶轨迹,只能向香农爸爸说声惭愧!如果考研顺利的话(目前不是到能保还是得考,但无关要紧),我转行去学计算机视觉和增强现实了。机器视觉的宗旨:让机器看懂世界,所谓“懂”字如何定义,有太多科学和哲学的蕴涵在里面了,作为尚未入门的小白充满未走入江湖式的激情澎湃。至于增强现实,利用这个技术,个人非常憧憬可穿戴设备(尤其是眼镜)可以作为增强人类视觉能力的载体,并作为下一代像移动手机一般火热的通信娱乐终端。
《The Book of Why: The New Science of Cause and Effect》前言笔记
笔记涉及三个方面:
- 本书的主旨
- 因果推理的一些要点
- 一个因果推理模型的介绍
主旨
图片来自微信公众号专知这本书的主作者是贝叶斯网络之父Judea Pearl。他认为,人工智能领域陷入了概率关联的困境,而几乎所有的深度学习突破性成果本质上来说都只是些曲线拟合罢了。机器不单要解决概率关联问题,还要具备因果推理的能力,这是发展强人工智能的必要条件。
基于Pearl和他的同事在近年来在因果推理领域做出的一系列成就,他认为是时候向广大吃瓜群众科普他的部分工作了,在书中作者用尽量简单的非数学语言描述了因果推理的一般框架,并用生活中非常形象的例子去诠释这些框架是如何工作的及如何影响我们的生活。其次书中也分享了一些关于探索因果推理过程的一些先驱者的故事以及因果推理对发展强人工智能的重要意义。
因果推理的一些要点
因果推理有别于统计学的最大一点,作者认为是“看到”和“做到”的区别:
Note that P(L | D) may be totally different from P(L | do(D)). This difference between seeing and doing is fundamental and explains why we do not regard the falling barometer to be a cause of the coming storm. Seeing the barometer fall increases the probability of the storm, while forcing it to fall does not affect this probability.
P(L | D)对应统计学里面的“看到”,指事件D发生前提下事件L发生的概率,而P(L | do(D))对应因果推理的“做到”,指对事件D做出干预情况下事件L的概率。文中作者用一个例子解释两者的区别:假如事件D对应气压计的读数下降,事件L对应风暴发生,P(L | D)就对应了观察到气压计读数下降时未来风暴发生的概率,而P(L | do(D))对应人为让气压计读数降低,未来风暴发生的概率。听起来感觉这个干预毫无意义,几乎每一个人都知道人为降低气压计读数并不能招来风暴(如果能,恭喜你发明的风暴发生器!)但单纯用统计学方法,机器无法从它读入的数据里分析出这个简单的因果推理:气压计读数无法改变天气情况。这就是机器如果能做出干预的意义所在:让机器学会“如果。。。那么。。。”的句式,让机器学会观察,推理,学会思考!
因果推理模型允许机器对预测(而不是对真实数据,这会在下文的一个模型中反映出来)做出干预,同时因果推理模型还有一个很重要的特征:反事实。
As with predicting the effect of interventions (mentioned above), in many cases we can emulate human retrospective thinking with an algorithm that takes what we know about the observed world and produces an answer about the counterfactual world.
反事实允许机器针对预测的不同输入,根据设计的算法进行反事实应答,从而达到干预的效果,而不是用数据去真正验证这个预测。这个不同输入不是随心所欲的揣测,而是真实反映我们认知世界里的世界模型。比如上文的例子,反事实允许机器预测这样的概率:如果让气压计读数下降,未来风暴发生的概率是怎样的?如果维持气压计读数不变呢?在一系列反事实预测中,机器能掌握事件之间的因果联系,达到推理的目的。
Counterfactuals are the building blocks of moral behavior as well as scientific thought. The ability to reflect on one’s past actions and envision alternative scenarios is the basis of free will and social responsibility.
作者认为反事实是道德行为的基石,也是科学思想的基石。反思自己过去的行为和设想其他方案的能力是自由意志和社会责任的基础。(关于此我的理解不深,待读完后续章节,有了一些思考后再做总结)
一个因果推理模型的介绍 图片截取自该书
这是一个三输入三输出的模型,三输入:假设,询问和数据。三个输出:其一是"yes or no"应答,作为在当前因果推理模型和完美无遗漏的假设,无限的数据(假设的数据)前提下,能否对询问做出回答(yes or no),其二是"Estimand",它是一个在假设的数据输入情况下得出的一条数学公式当做询问的具体回答(我理解这也相当于图中的"Testable implication")。其三是"Estimate",是在推理模型接受真实数据后产生的对问题的估计。上文提及的反事实干预就作用在产生第二个输出的过程上。
单纯的统计学没有干预这一步骤,相应地这成为因果推理相对于统计学的一大优势
if we want to teach a dumb robot to think causally, or if we are pushing the frontiers of scientific knowledge, where we do not have intuition to guide us, then a carefully structured procedure like this is mandatory.
干预允许机器去处理事物的因果联系,也有助于我们在推动学科前沿,在没有直觉指导时运用因果推理去处理问题。
Another advantage causal models have that data mining and deep learning lack is adaptability. Note that in Figure I.1, the estimand is computed on the basis of the causal model alone, prior to an examination of the specifics of the data. This makes the causal inference engine supremely adaptable, because the estimand computed is good for any data that are compatible with the qualitative model, regardless of the numerical relationships among the variables.
另一个干预的好处体现在,正如上图所示,机器在接收真实数据之前,已经根据假设的数据做出可测试的推断,当接受真实的数据,该模型能从数据中抽取出对模型有用的维度,而减少其他无用的数据维度对模型的影响。而这在基于纯粹统计学的机器学习和深度学习是做不到的,后者每当数据变动,会重新根据输入数据去拟合数据的预测曲线。
后记
限于英语阅读理解能力堪忧,所以以上的总结肯定会有不少的错误甚至是常识性的误解,欢迎指出。总结的目的是待后续对该领域深入理解后回过头来反思当前的不足。对机器视觉,增强现实,机器伦理有了解的朋友跪求带飞我!
我相信作者对强人工智能的未来的警惕而乐观的。正如他在文章所说:
the problem of automating human-level intelligence (sometimes called “strong AI”). I believe that causal reasoning is essential for machines to communicate with us in our own language about policies, experiments, explanations, theories, regret, responsibility, free will, and obligations—and, eventually, to make their own moral decisions.
there is no better way to understand ourselves than by emulating ourselves.
网友评论