美文网首页技术类程序员@产品
Michael Jordan:当下的AI其实都是伪“AI”

Michael Jordan:当下的AI其实都是伪“AI”

作者: 阿里云云栖号 | 来源:发表于2018-05-02 14:47 被阅读208次

    摘要: Michael Jordan认真的解读当下的AI到底是什么?

    人工智能(AI)是未来的趋势,这句话是技术人员、学者、记者和风险投资家一致赞同的。如同从技术学术领域跨越到普遍行业的许多词语一样,在使用这些词语的时候都存在很大的误解。我们这个时代的最想在某种程度上看到了硅片中的智能的出现,它与我们自己的娱乐相媲美,激励我们并以同样的方式恐吓我们。

    关于当今的时代,有一种不同的叙述。考虑下面的故事,它涉及人类、计算机、数据和生死决定,但这个故事的重点不在于硅片中的幻想。当我的妻子在14年前怀孕时,我们进行了超声波检查。房间里有一位遗传学家,她指出胎儿心脏周围有一些白色斑点。这些是唐氏综合征的标志,她指出,现在你的患病风险已经上升到了1/20。她进一步告诉我们,他们可以通过羊膜穿刺术查看胎儿实际上是否具有唐氏综合征的基因改变。但是羊膜穿刺术风险很大,在手术中杀死胎儿的风险大约为1/300。作为统计学家,我决定找出这些数字来自哪里。在研究的过程中,我发现一个统计分析,它在英国已经进行了十年,这些反映钙积聚的白色斑点确实是唐氏综合症的预测指标。但我也注意到,在我们的测试中使用的成像机器比英国研究中使用的机器每平方英寸多几百个像素。我回过头来告诉遗传学家,我相信这些白斑可能是假阳性,它们实际上是“白噪声”。她说:啊,这就解释了为什么我们这几年唐氏综合征诊断的增加了。

    我们没有做羊膜穿刺术,几个月后出生了一个健康的女孩。但是这一事件让我感到困扰,我确信全世界每天有成千上万的人得到这种诊断结果,其中许多人选择了羊膜穿刺手术,而且一些婴儿可能也因此造成不必要的死亡。其实这个问题不仅仅与数据分析本身有关,而且与数据库研究人员称之为“来源”的问题有关。

    作为一名计算机科学家,我首先想到的是建立一种推理和决策系统所需的原则,将计算机科学与统计学相结合,来解决一些现实中存在的问题。不仅在医疗领域,而且要在商业、交通和教育等领域,这些原则的发展至少与建立AI系统的原理一样重要。

    无论我们是否能够接受“智能”,我们​​都面临着一个现实:人工智能正在改变我们的生活。尽管有些人认为这是屈从于“人工智能”的创造,但也可以用更温和的方式去看待它,把它当称一个新的工程分支一样。就像过去几十年的土木工程和化学工程一样,这门新学科的目标是收集几个关键思想的力量,为人们带来新的能力,并且安全地做到这一点。鉴于土木工程和化学工程建立在物理和化学之上,相应的这个人工智能是建立在过去的给予的基础上­——“算法”、“数据”等等。

    不幸的是,我们并不善于预测下一个正在出现的严重缺陷。我们缺少的是一个具有分析和设计原理的工程学科。

    目前关于这些问题的公开对话过于频繁地使用“AI”作为智能通配符,这使得很难推断新兴技术的范围和后果。所以请让我们从更仔细地考虑最近和历史上用“AI”来指称什么。

    今天大多数被称为“AI”的东西,特别是在公共领域,都被称为“机器学习”(ML)。在过去的几十年里,ML是一个算法领域,它将来自统计学、计算机科学和许多其他学科的想法融合在一起,设计算法来处理数据,做出预测并帮助做出决定。就对现实世界的影响而言,ML是真实的。事实上,ML在20世纪90年代初期就变得非常清晰了,到世纪之交,亚马逊等具有前瞻性的公司已经在他们的业务中使用了ML,从而解决了欺诈行为中的关键任务:后端问题检测和物流链预测以及建立创新的面向消费者的服务,如推荐系统。随着数据集和计算资源在接下来的二十年中快速增长,很明显,ML不仅为亚马逊服务,任何公司的决策都开始与ML相关联。“数据科学”这个短语开始被用来指代这种模型,反映了ML算法专家需要与数据库和分布式系统专家合作建立可扩展的、强大的ML系统。

    从历史上看,“人工智能”这个词在1950年代后期被创造出来,指的是在软件和硬件中实现具有人类智能的实体的强烈愿望。我们使用“模仿人类智能”一词来指代这一愿望,强调人工智能实体似乎应该是我们中的一员,至少是在精神上或者身体上。虽然运筹学,统计学,模式识别,信息论和控制论等相关学术领域已经存在,并且常常受到人工智能的启发,但这些领域可以说是集中在“低层次”信号和决策上。比如松鼠能够感知它所居住的森林的三维结构,并在其分支之间跳跃,对这些领域是鼓舞人心的。“人工智能”旨在集中精力于不同的事物,例如:人类“理性”和“思考”的“高级”或“认知”能力。然而,60年后,高级推理和思想仍然难以捉摸。目前被称为“人工智能”的发展主要出现在与较低级别模式识别和运动控制相关的工程领域以及统计学领域,主要侧重于找到数据模式并进行有根据的预测,假设和决定的测试。

    事实上,20世纪80年代早期由David Rumelhart发现的著名的“反向传播”算法,现在被视为所谓“AI革命”的核心,最早出现在20世纪50年代的控制理论领域和20世纪60年代,其早期应用之一是优化阿波罗太空船在朝向月球时的推力。

    自20世纪60年代以来,人工智能取得了很大进展,但它可以说并不是来自追求人性化模拟人工智能。相反,就像阿波罗太空船一样,这些想法常常隐藏在幕后,尽管对公众不可见,但文档检索、文本分类、欺诈检测、推荐系统、个性化搜索、社交网络分析、诊断A / B测试等领域的研究和系统建设取得了重大成功。

    人们可以简单地同意将所有这些称为“AI”,但这样的标签可能会让统计学研究人员感到意外,这些研究人员醒来时发现自己突然被称为“人工智能研究人员”。过去二十年间,训练AI的愿望通常被称为“智能增强”(IA),主要是使用计算和数据来创建增强人类智慧和创造力的服务。搜索引擎可以被看作是IA的一个例子(它增加了人类的记忆和事实的知识),自然语言翻译(它增强了人类沟通的能力)也是如此。基于计算的声音和图像生成可以作为艺术家的调色板和创意增强器。虽然这种服务可能涉及高层次的推理和思想,但目前他们不这样做,相反他们大多执行各种字符串匹配和数字操作,捕获人类可以使用的模式。

    让我们广泛构思“智能基础设施”(II)学科,即存在一个计算,连接数据和物理实体网络,使人类环境更具有支持性、趣味性和安全性。这种基础设施开始在交通,医药,商业和金融等领域出现,对个人和社会有着巨大的影响。它有时出现在关于“物联网”的讨论中,但是这种想象通常指的是仅仅是将“事物”带到互联网上的过程,而不是与能够分析这些“事物”。

    例如,我们可以想象将我们的生活置于一个“社会规模的医疗系统”中,它建立数据流和数据分析流程,位于人体内和周围的医生和设备之间,从而能够帮助人类诊断和提供护理。该系统将纳入身体细胞、DNA、血液检测、环境、群体遗传学和关于药物和治疗的大量科学文献的信息。它不仅仅关注单个病人和医生,还关注所有人类之间的关系 ,就像现在的医学检测允许在一组人类(或动物)上进行的实验。这将有助于保持相关性、可靠性。而且,人们还可以预见到这样一个系统出现的许多问题:涉及隐私问题、责任问题、安全问题等,这些问题应该被视为挑战,而不是阻碍者。

    我们现在遇到了一个关键问题:模拟古典人性化人工智能是面临这些更大挑战的最佳选择还是唯一方法?事实上,最近最受欢迎的ML的成功案例就是人类模仿AI相关的领域,如计算机视觉、语音识别、机器人等。这里有两点需要说明,首先,尽管人们不会从阅读报纸中得知它,但人造模拟人工智能的成功实际上是有限的,我们距离实现人性化模拟AI还很遥远。不幸的是,在仿人工智能AI方面进展甚微的情况下,出现过度夸赞和媒体关注的水平,这在其他工程领域并未出现。

    其次,更重要的是,这些领域的成功既不足以解决重要的IA和II问题。为了实现自动驾驶汽车这样的技术,需要解决一系列工程问题,这些问题可能与人力资源关系不大。整个交通系统(一个II系统)可能会更像目前的空中交通管制系统,而不是目前收集的松散耦合的、不具有前瞻性的人类驾驶员技能信息。因为它比当前的空中交通管制系统复杂得多,特别是在使用大量数据和自适应统计建模来决策时。(地面交通的情况要比空中更负责)

    我们不难确定II系统中的算法和基础设施挑战,这些并不是人类模仿AI研究的核心主题。II系统需要管理分布式知识库,这些而且知识库正在迅速变化,并且可能会在全球范围内不连贯。这些系统必须在做出及时的分布式决策时应对云端相互作用,并且他们必须处理长尾现象,因为我们不具有大量的个人数据。他们必须解决跨行业和竞争性界限分享数据的困难。最后,特别重要的是,II系统必须将诸如激励和奖励之类的经济理念带入统计和计算基础设施领域,这些基础设施将人与对方以及有价物品联系起来。诸如音乐,文学和新闻等领域正在呼吁出现这样的市场,数据分析将生产者和消费者联系起来。这一切都必须在不断演变的社会,道德和法律规范的背景下完成。

    当然,经典的人造仿真AI问题仍然值得关注。然而,目前的重点是通过收集数据进行人工智能研究,部署“深度学习”的基础设施,以及模仿某些狭义定义的人类技能的系统演示问题。这些问题包括:需要将意义和推理引入进行自然语言处理的系统中,需要推断和表示因果关系,需要开发计算上易于处理的不确定表示,以及需要开发制定并追求长期目标的系统。

    IA也是相当重要的,因为在可预见的将来,计算机将无法与人类相匹配地抽象描述现实世界的情况。我们需要经过深思熟虑的思考和计算机互动来解决我们最紧迫的问题。我们希望计算机能够触发新的人类创造力水平,而不是取代人类的创造力。

    John McCarthy创造了“人工智能”一词,显然是为了区分他的新兴研究议题与诺伯特维纳的研究议题。维纳创造了“控制论”来指代他自己的智能系统愿景,这一愿景与运筹学、统计学、模式识别、信息论和控制理论密切相关。很显然,今天的“人工智能”的热度远远超过了“控制论”。但我们需要超越麦卡锡和维纳的特定历史观点。

    我们需要认识到,目前关于人工智能的公众对话(侧重于狭隘的行业子集和狭窄的学术子集),可能使我们面临AIIAII所带来的挑战和机遇的风险。

    这个风险不是关于实现科幻梦想或超人类机器的噩梦,更多是关于人类理解和塑造技术的需求,因为它在日常生活中变得更加现实和有影响力。此外,在这种理解和塑造中,需要来自各行各业的不同声音,而不仅仅是技术上的对话。

    虽然行业将继续推动技术发展,但学术界也将继续发挥重要作用,不仅在提供一些最具创新性的技术理念时,而且来自其他学科的研究人员的观点也非常重要,特别是社会科学、认知科学和人文科学。

    而且,我们应该接受这样的事实:我们正在创建一个新的工程分支。“工程学”这个术语通常在狭义上被引用,在学术界它通常指的是带有冷酷无情的机器的泛指,以及人类失去控制的消极内涵。

    但,在当今时代,我们有一个真正的机会来设想一些历史上的新事物 - 一个以人为中心的工程学科。

    本文由@阿里云云栖社区组织翻译。

    文章原标题《the-fall-of-rnn-lstm》,

    译者:虎说八道,审校:袁虎。

    详情请阅读原文

    相关文章

      网友评论

      • 编走编想:乔丹原来不光会打篮球,原来还懂 AI

      本文标题:Michael Jordan:当下的AI其实都是伪“AI”

      本文链接:https://www.haomeiwen.com/subject/pkgqrftx.html