美文网首页理解未来
IBM中国研究院总监苏中:多模态数据分析在认知商业中的应用

IBM中国研究院总监苏中:多模态数据分析在认知商业中的应用

作者: 未来论坛 | 来源:发表于2016-03-30 12:02 被阅读164次

    在《理解未来》走进京东”专场活动中,苏中就时下大热的人工智能及大数据等相关话题提出了自己的见解。他认为,我们不应陶醉于AlphaGo的胜利,而是应当将“找到实际的、可以用的、能够解决真实应用的场景来解决实际的问题”作为发展目标,人工智能技术还有很长的路要走。以下是苏中的演讲:

    人工智能处在一个非常好的时代。我不觉得现在是人工智能的“回暖期”,现在应该是“盛夏”。为什么这么讲?我太太在家相夫教子很多年了,不出江湖,前两天问我蒙特卡罗树是什么?那么优美的名字。我说你下一个问题是不是卷积神经网是什么?在这样的大环境下,人工智能到底会不会真正取代人类?你的工作会不会机器人取代?很多有意思的话题都这样发生了。

    IBM的思考

    IBM研究部门一直在做很多技术思考。我们很大的任务是给公司来指引方向。这个公司有100多年,跟清华是同一年诞生的。活100年的公司很少,活100年的科技公司更少。IBM早期做过称、打卡机、电脑,现在做认知计算。我们研究部门很大任务是要看未来技术的发展、产业的发展会怎么改变这个世界。

    IBM有很多业务部门每年都在不停地更新。它有一个伟大的梦想,是从一开始就要看到十年以后技术走的怎么样。这是很可怕的事情。如果我没有记错,将IBM带入IT时代时的伟大创始人叫沃森,是他把IBM带到了新的航道。计算机造出来的时候,可能只用于人口普查方面的任务。当时他说:“世界上将来只需要几台这样的机器就够了。”因为他想不到计算机将来有一天进入家庭。虽然他是一个睿智的企业家和令人尊敬的人,做“未来的预测”永远是危险的

    2012年的时候,我们研究部门已经想到很多数据可以用,但用的时候遇到到很多挑战。到2013年就会讲很多数据是哪来?一个是人产生的。为什么产生那么多数据呢?因为移动带来的。今天在座很多人发微信,发一条微信就产生一条数据。还有一个就是传感器,这个楼里可能有很多传感器,各种摄像头、温度、湿度,各种传感器,不断的产生数据。这些数据带来什么呢?它可能帮你的企业提供更好的决策

    我们部门的Topic每年都有四五个,IBM是什么都做,硬件、软件、服务都做,去年只有一个题目,就是DATA。深度神经网也不是今天才提到的。很多算法以前十几年不work,今天就work了,为什么呢?其实两个因素在推动。一个是计算能力比以前强了,很多种算法可以做各种各样的优化;另外一点,就是数据,各种标注的、非标注的海量数据帮助你的算法。数据本身带来了一个很大的变化。

    智能是什么

    回过头来讲人工智能,是不是真的可以改变世界、改变人类?我自己的看法是这样的:人类认识物理世界的时候其实是很伟大的。很多国家在一起,在构建很大型的对撞机,看物质的构成原理是什么,从而来理解我们的世界,知道宇宙历史怎么发展的。我们对物理的认识已经到了很精细的程度。而我们讲人工智能,智能是什么呢?

    它是我们生物体脑的部分在做的一件事情。这其中有两个难以逾越的障碍:第一个,生命是怎么起源的?物质是怎么回事,宇宙是怎么起源的?很多人做了各种各样的设想,但是没有一个人在实验室里把它重现出来,就算是重现一个最基本的氨基酸都是很困难的。第二个,脑是怎么工作的?思维是怎么产生的?这是更可怕的一件事情。很多物理学家开始研究这个的时候,我们就说他已经疯了。我们现在很多大数据、智能的算法,其实无外乎就是在数学上用一些回归的方法,用一些模式识别分类的方法,从数学上把它呈现。就像拿一个放大镜观察原子是怎么回事,很难想到达到真正的智能

    多模态数据

    我今天讲一下多模态数据。数据产生了,我们有各种各样的算法来解决、分析这些数据,AlphaGO可以去学习人类专业选手的对局,学习评价函数,看看下一步走那儿。

    但是,数据本身是多种多样的。举个简单的例子,大数据、智能技术可以用在很多方面,比如让我们活得更好、更健康。这是一个什么样的数据呢?人的健康状况是受什么决定的?很多人说,我是先天不足,从小就瘦;或者我妈就是老胃病我也是胃病。但是通过数据发现,人只有30%的健康状况是由基因决定的,而60%甚至更多是由你的生活方式决定的。从这个角度来看,如果想活得更健康,或者提供更好的治疗,只关注30%的数据是不可以。人的基因数据大概6个TB,这个数据量很大了,可是我们每天生活的数据后面还要多两个零。

    为什么要讲多模态呢?我们很多数据是以各种各样形式发生的,比如说医院的电子病例医生是拿Word写的,里面写的基本上机器看不太懂,普通人也看不懂的内容。各种各样的检测手法,去查个血,会产生结构化的数据,比如血脂高还是血脂低。如果考虑时间的变化肯定是持续的数据。我们有时候还会去做核磁扫描,是图象数据,识图又不是计算机擅长处理的。行为数据更纷繁复杂。今天在京东买了点东西,晚上又看了场演唱会,这是非常复杂的数据,没有一种办法、一个工具能把所有的数据都分析好。更具有挑战性的是,这些数据是关联的。为什么讲多模态数据的分析是很难解的问题?第一,结构化数据分析比较容易,非结构化数据分析比较难。第二,这些数据之间有关联,有问题它就有机会、有价值,所以我们看到很多企业、公司、机构都在往这方面做。

    通用工具

    AlphaGo使人工智能在社会上产生了很大的舆论,其中有很多种说法。对于围棋我只会看不会下,但我知道围棋很难。它有人生哲学、经历、大局观、计算在里头,对计算机来说几乎是很难穷尽的场景。这样一个任务,被机器给解决了,看起来似乎是机器迈过了一个很大的坎。我们内部讨论过,其实这没有什么。人工智能提出时的著名会议——“达特茅斯会议”的参会者,IBM的Arthur Samuel,他当时在IBM701的机器上,把西洋跳棋程序实现了,打败了美国的州冠军,IBM股票涨了百分之十几。大家

    惊奇,怎么打卡机突然之间这么智能了!当时也是无限憧憬。

    6、70年代发生的事情,和今天发生的事情从技术角度相比其实没有本质区别。从当时下国际跳棋到1997年IBM深蓝打败卡斯帕洛夫,说明机器下棋确实比人下得好。但从另外一个角度说,它只能处理这样的数据,就像是让深蓝干其他的事情也很困难。它解决了一个很窄的领域里一种数据的分析,而且做得很好,并不意味着现实当中任何一个很简单的健康问题它都能处理得很好,这是技术还没有达到的。另外从中国人的哲学思想角度讲,中国人吃饭就是一双筷子,我们吃油条也是它、西餐也是它,包括汤圆都能夹起来,这样的通用工具才是我们需要的。解决所有广谱的问题才是真正重要的事情。从这个角度讲,对通用工具有很好的建模,技术还有很长的路要走

    未雨绸缪

    大数据时代,在这样火热的环境里,盛夏既然到来了,秋天就不远了。我们还是要找到实际的、可以用的、能够解决真实应用的场景来解决实际的问题,让人工智能不再进入第三个冬天。谢谢。

    文章转载请注明出处为 “未来论坛”微信账号(ID:futureforum)

    未来论坛官网:www.futureforum.org.cn

    “未来论坛”是由中国时下深具影响力的一批互联网先行者、投资界成功者、科技业前沿者发起,并于2015年1月20日正式创立。“未来论坛”将网罗全球最新技术和有洞见的人, 进行跨界、跨地域、跨年龄的交流与互动。它提供了一个入口,一个平台,让人们在基础逻辑的普适认知下,去获得方向感,去感知影响力,去踏进一片净土,去得到思想的孵化。

    “理解未来”系列讲座,由“未来论坛”倾力打造,是面向社会大众开放的高质量月度科普讲座。“理解未来”系列讲座邀请富有洞察力、创新性和前瞻性的知名科学家和创业者与大众分享交流对未来的认知,促进社会大众对未来的理解与思考。

    相关文章

      网友评论

        本文标题:IBM中国研究院总监苏中:多模态数据分析在认知商业中的应用

        本文链接:https://www.haomeiwen.com/subject/sqaslttx.html