2017初橙·阿里校友企业黄埔榜--企业服务峰会,阿里云人工智能首席科学家闵万里(江湖人称:山景)给大家分享“不变性原理与人工智能实践”。
一、 “创业”OR“创新”
今天之所以来到这里,我所做的事儿和大家是一样的,我带了一支团队在阿里内部创业,内部创业比外部创业更难,因为我们得到的质疑比支持更多,为什么?首先我不是平台型的打发;其次我不做2C,做B端;三是项目制。但是700天过去了,我们活下来了,做出了几个行业内世界上首次的东西,价值得到了证明。
2015年6月1日,我加入阿里云,和孙权说我要做什么,旁边有人问道“创新和创业你怎么看?”我的回答是:
第一,我不做业余爱好,要做事业、做行业。
第二,我不做深度学习,今天也不会讲到深度学习。
我要做的是什么?做基础领域的创新,做别人做不了的事儿,所以我能够颠覆一个行业。
这是过去700天新闻媒体的报道,我们从一个人开始,现在有80多个人。
过去十多年的智慧城市的建设,到今天为止,只是铺了一堆机器、搞了一堆机房,数据还是割裂的,这是为什么我们选择“城市大脑”的原因。数据都有了,智慧在哪里?交警的机房、城管的机房是不通的,交警机房当中视频数据和信号灯的数据也是不通的,光杭州就有海康、大华、中控和一些不知名的企业,当所有数据在一张屏上,背后实时打通就可以用起来,之后智慧就出来了,这个效果很简单,可能大家也看过。
这是实时计算的, 每一辆车进行追踪,左转、掉头都能实时识别出来,可以精准地知道在杭州的每一个路口,混合交通的成分量化是多少。有了这些“量”,把数据再推进一步,让交警能够看清楚量化指标,再配合移动互联网的数据,就可以把这个城市大脑做起来。
这是我们团队的出山之作,选择了大家比较关心的娱乐事件。我们想用算法计算情感,计算人对音乐的认知,后来发现这只是给大众做娱乐,带来的真正价值不是那么直接,所以我们很快做了“城市大脑”。它的核心是什么?是“数据智能”,也是我们团队创新最核心的东西,也正是因为有阿里云的大数据产品。
大家一定会说,为什么腾讯云、百度云、亚马逊云做不了呢?其实他们都能够做,不过是谁愿意迈出这一步而已。
二、核心靠“原创”
“算法能力”是我们最核心的竞争力,像“计算能力”就是产品。我们讲ODPS,到“全面的解决方案”,中间嫁接的算法能力是最核心的。阿里云人才储备相对比较多,所以我们有先发优势。
核心算法能力在哪里?是靠“原创”。讲这些案例都没有用到神经网络,所以我们能够做到别人做不了的东西。我们研究大脑的神经网络,就是人真正的脑部。人的大脑有10个10次方神经元,大概百亿级。在百亿节点的网络上我们要传递的是什么?信息流,一天的量级到达100个PB!大数据处理能力已经到了这个量级了,很多事情可以去用“暴力”的方法去做,去做什么呢?
举个例子,左边这个图读取人的脑电波信号,中间这个图就是你看到的各个通道的信号。这些信号干什么?我们做特征提取,再做分类器和预测模型,推测这个人处在什么样的状态,这是很早就有的事儿,七八十年代已经开始做脑电波的研究。后来,处理能力慢慢上去以后,采样的频率就高了。我的第一篇美国专利就做这个事儿。今天在云计算的基础上,整个信息处理能力有了量级的提升,处理的通道更多,每个通道信号是上千个赫兹,这是一个海量的流式计算,以往不能做,现在有了云计算不是什么难题。这是一个高度抽象的信息网络,可以用在我们的大脑当中,可以用在城市当中,还可以用在其他地方。
在网络上,我们的神经元是有一定关联的,是有一定被激活的先后顺序和传递的。比如你的头皮发麻,其实就是脑区细胞神经元被激活了,我们要研究这个信号怎样从一个神经元传递到另外一个神经元。
这是具体的技术,我不讲了。最核心的东西就是算法的原创,可能是我们和其他人最大的区别。我们用原创的东西去解释,当你在网络上看到重复非常多次的信息后,可以把信息综合起来找到一些分布特征的,接着就可以做预测了。学过统计学的就知道,这叫做中心极限地理,后来应用到了统计物理。在我们的认知、脑部神经网络当中也发生过类似的事儿,有一句成语叫做“似曾相识”,就是你的脑部神经网络激活状态出现了往日的稳定态。
我们做了一件很重要的事情,就是对于一个城市网络,当你在有颜色的点上被激活后,会怎样向周边蔓延。解决这个问题的核心就是把网络做成抽象的数学模型,要看这个模型当中参数、矩阵,结构是什么样的,找到某一个神经元波及和哪几个特殊路径相关。70年代就开始做这件事儿,2005年彻底解决了。这不是计算机系应该学的东西,而是数学系的。解决了这问题以后立刻出现了一个结果。
我们把新加坡CBD的糟糕的交通状况改善了,当时我们做的就是寻找最小充分子网,把整个网络写成一个大矩阵的时候,如果很多地方是0的话就知道网络信息传播有一个特殊的路径,避开了0。我们所有技术都是在找那些0的地方在哪里。
这是去年我们在广州做的,今年会全面铺开,把信号灯全调了,实时控制。以往信号灯是人工调或者机器固定模版,如今靠互联网数据动态调。现已经在中国好几个城市全面推开。
具体细节不多讲,价值是很显然的!不光是社会价值,还有商业价值。路口一个传统信号灯要10万块钱,用我们这一套东西大概1万块钱一年。
实时调度,前几年O2O是比较流行的,在共享单车、送餐、最后一公里物流当中都会遇到。遇到的挑战是高并发、动态网络上怎样最优化地系统调配,形式路径和实时分配订单我们也做到了,背后的核心就是把网络流解析出来,找到最优的路径。
这是一个三国游戏,比下围棋还难。一个是送餐的、一个是出餐的、一个是订餐的,中间的路径还是动态的,这个复杂度比围棋还要难。
再看“工业大脑”,在这个生产线上流动的不光是产品,还有各种数据。工业生产线、物联网的数据不比移动互联网少,只是我们老百姓平时不感知。物联网数据一秒钟是好几千个读数,尤其是涡轮发动机,可能一个发动一年数据就好几十个T,这是一个巨大的海量的数据场景。今年,我们做了一个很简单的事儿,还是把这些数据串在一起,实时弄在云上,在云的大平台上打通,从经验、规律、特征等等,最后做到叫做“机器的神经网络”,相当于把这个生产线各个环节串联成一个神经网络,配以工业人工智能,最后能实现实时控制生产线,和控制信号灯是一样的。
最终得到的效果是1%,如果映射到这家工厂及一年上亿产值,映射到整个行业更不得了,因为这是一个光伏产业。
我们还另外在做一个风力发电机,也是和老百姓息息相关,事实上数据非常密集,在山上、在海中。比如,海上风桨坏了要派轮船去换,出场费就是27万,但是做预测性维护,只需2万块,成本差距非常大。如果提前两个月发出预警的话,更换一个轴承2万块。这是一个真实的案例,在西北的山顶上的风机,我们抓住了这个信息,一个风机省了差不多25万块钱。中国有多少风机?几十万个,价值可以放大。
我们常讲一个1%的故事,新闻上也说到了工业制造,其实起点很简单,把流程中的效率提升一个比分点。我们不求多,只提高一个百分点。这一个百分点的价值,可能是一分钱投标,也可能做1%的效率的提升,我们选择的是后者。
新闻上也有报道,我们做了一个中策橡胶。朝阳轮胎大家都知道,我们提了3个百分点,这是什么概念?这是一家上市企业,我们把中国一家炼钢企业又提升了。所有的一切是把生产线嫁接到神经网络中,再把数据放到大数据平台上实时调控,让机器学习算法自动化调控,调出来的效果比工人师傅的经验还要好,而且不会下班、不会退休、不会跳槽,成为一个可持续发展的解决方案。
刚才讲的1%只是一个泛指,更多的比1%还要多,我们只做别人做不了的事儿,还做价值含量更高的事情。模式创新是业余爱好,模式创新不具备专利性。黄色单车出来了,红色的也出来了,模式的创新很难持久,所以我们要做技术创新,找技术要红利。我们要“用技术驱动商业的边界”,其实我们就在做这个事儿,把阿里云数据算法挖掘出来,光有算法还不够,还要有场景,比如说“城市大脑”、“工业大脑”,因为资金密集、数据密集、痛点明确。
我们迭代速度越来越快、可复制,不再是项目制。我们做到了最小的抽象,抽象就是大脑的神经网络,机器生产线也是有生产网络的,在这基础上复制就可以了,所以把技术做好一定有价值存在,找准商业模式。
今天还有一个目的,我是阿里云的小二,希望让走出去的校友们创业更加便捷和成功,我们能够通过技术把大家的时间成本降低,很多时候大家没必要重新建机房、买服务器、招人。时间成本非常宝贵,用我们的服务,很快就可以看到效果。以前想都不敢想,现在我们做到了!如果你的创业公司有技术问题、有大数据的问题,可以去招人,也许半年以后招到人,也可以找到我们,我们是完全开放的态度,让大家能够成功,也让我们能够成功,谢谢大家!
以上内容是阿里云人工智能首席科学家闵万里山景在本次2017初橙·阿里校友企业黄埔榜--企业服务峰会上的分享。
想参加更多精彩峰会,想听到更多干货分享,关注“初橙资本”,每月一场千人大会,等你来参加!
网友评论