A.I. IS COMING; 人工智能将至
号外,号外,2016年3月,谷歌的AlphaGo(阿尔法围棋,亦被戏称为阿尔法狗或阿法狗)4:1大胜围棋大师李世石。这一历史性事件。。。(此处略去新闻稿一万字)
当时,第三场比赛是这场比赛的第一个赛点。前两局,阿尔法围棋(尽管叫这个名字很别扭,还是比戏称名字好一些)以2:0的优势领先。如果阿尔法围棋再次取胜,从赛制上也就拿下了这整场比赛。在我看来李世石处于比较大的劣势。特别是在这种双方信息如此不对等的情况下。李世石对于阿尔法围棋知之甚少,他的假想敌是六个月前和樊麾对战的阿尔法围棋。而阿尔法围棋却是有备而来,在他的眼里李世石是实实在在的一摞对战棋谱。他不仅可以和这个虚拟的李世石反复训练,还可以逐步提高虚拟李世石的棋力,左右脚互博,逐步提高。但是,新闻里面的各种怀疑的理论也是说的有模有样。最让人信服的一派说法是:“在XXX步上,阿尔法围棋本可以这样下取得更大优势,但是他却没有,所以最后也只能小胜。虽然说这一盘棋他赢了,但是棋力上来看他并不一定占优“。
最后,阿尔法围棋稳稳的小胜第三局,最后以4:1的比分结束了这五场比赛。这场比赛也成了这场人工智能热潮的引爆点。一石激起千层浪,“人工智能要抢人类工作“,”高技术水平的工作更容易被取代”,“奇点(link)要来啦"等声音不绝入耳。怀疑和反对的声音几乎被淹没。
从低估(或者不了解)到神化(或者妖魔化)这一转变来得突然,并且迅速。我们飞奔着从一个极端跑到了另外一个极端。 这一过程里,必然错过了很多细节,同时又夸大了一些事实。这个不寻常的转变促成了我写【白话AI】这个想法。希望能通过这一专栏,给大家带来对人工智能的更客观的认识,从而更好的让其为我们所用。
机器学的是什么?
相信和大多数人听到“机器学习”时的第一印象是——“机器像人一样学习”。所以人能学什么,机器就应该学什么。当然这是终极目标,但就目前的技术发展程度来看,特别是我们都不清楚我们能学什么的时候,这个目标显得有点不切实际。这里,我认为当我们说”机器学习“的时候指的是——让机器自己学习客观现象从而产生算法。
那么什么是算法呢?
广义上来讲,算法是一系列逻辑指令,由最基本的 AND(和),OR(或),NOT(否)组成,把一组输入转换成一组输出。这里的输入,输出,和指令可以是任意我们现代科技能达到事件或动作。
举个例子:
- 打开冰箱门, 2. 把大象放进去,3. 关上冰箱门
虽说第二步骤很荒谬,但如果我们确实有一个足够大的冰箱,这也是一个合理的算法。输入是“把大象放到冰箱里”的指令,输出是”最后大象被关到冰箱里这一状态“。
尽管在几十年前,算法这个名词还不为大众所知。但是,我们现在已经活在一个由算法支配的时代。他们影响控制着我们生活的方方面面。
早晨6:30,你的闹表准时响起;
你开车上班时,你油门一踩,车就自动从一档换成二档了;
微信群里的发红包,你压根不用掏现金,钱就被分了;
对付病毒时,吃抗生素,立竿见影,药到病除。
这些算法并不是凭空产生的。从简单到复杂,这一个又一个的算法都是由各行各业的人一点一点的建立起来的。我们通过学习研究事物运行的本质,抽象出来概念和规律。然后运用物理,化学,生物,电子等等的手段,根据学习到概念和规律设计流程来达到我们想要达到的效果。这些算法叠加,进化,产生了一个又一个复杂而又庞大的算法,微信,百度,转基因大米,等等。
这整个过程可以抽象为一个学习算法的过程:
观察,研究 事物XXX >>> 总结,归纳 事物XXX的 概念和规律 >>> 设计算法控制 XXX
既然我们的这套方法都这么牛了,为什么我们还需要机器学习呢?
科学发现的本质需要有可证伪性,也就是任何理论都应该可以被证明为错误的。于是从牛顿的三大定律到爱因斯坦的相对论,我们不断用正确的替换掉错误的,用复杂的理论替换掉简单的。同时我们发现的规律和概念也随着我们的能力和工具的提高变得越来越复杂。在我们不断推进算法的能力的同时,这充满未知的世界似乎在以更快的速度展现出其复杂性。我们知道的越多的同时,也更多的意识到我们的无知。我们似乎处在一个永远也跑不赢的比赛中。
可是,既然我们可以自动化这么多东西,那么我们为什么不能自动化“学习算法”这个过程的本身呢?有了这个能力,说不定我们能赶上未知的速度,真正的从策略上具备处理这一复杂世界的能力。于是,机器学习的想法也就应运而生了。
机器学习——训练机器总结规律并产生算法。
机器通过什么来学习算法的?
现在我们回头再看算法产生的过程,请问什么东西是贯穿这整个过程的?
========== 请思考 =============
========== 请思考 =============
========== 请思考 =============
========== 请思考 =============
========== 请思考 =============
========== 请思考 =============
贯穿这整个过程的是“事物XXX”。他是产生一个算法的基准客观事实。如果我们要自动化产生算法的这个过程,这个"事物XXX"也就自然而然的成为了机器学习的输入了。那么机器学习的过程就可以理解为:
事物XXX >>> 机器学习 >>> 控制事物XXX的算法
当我们谈到“事物XXX”的时候,它是一个抽象的存在。我们需要对他的客观存在进行具体的观察和描述。这个“事物XXX"才能是一个实实在在的事物。例如,当我们看到一个魔方时,我们需要从各个角度观察它,试着多个方向旋转,操作,才能准确的定义,描述出什么是魔方。也就是说,准确的表达一个事物是基于我们对这个事物的客观了解。知道的客观事实越多,我们也就越了解这个事物。就像我们了解一个人一样。我们相处的时间越久,一起经历的事情越多,我们就越能确定的说我们了解一个人。同理,机器学习也是基于对于一个事物的观察,观察越多理解的越好。这里我们称对于一个事物的观察为数据。于是公式就进一步演化为:
数据 >>> 机器学习 >>> 算法
即 机器通过学习,理解数据,总结产出算法。
举个例子
数据:
- 2017,1月3日,下午 3点,买了一杯星冰乐
- 2017,1月4日,下午 3点10分,买了一杯中杯咖啡不加奶
- 2017,1月5日,下午 3点2分,买了一杯卡布奇诺
- 2017,1月6日,下午 3点3分,买了一杯美式咖啡
- 2017,1月9日,下午 3点5分,买了一杯摩卡
机器学习
处理数据: 一月3,4,5,6,9日分别是周二,三,四,五,一。
总结归纳:这个人喜欢在工作日下午3点4分左右买一杯咖啡,但是口味和前一天不一样。
算法:
在没个工作日下午3点的时候,手机上弹出一个窗口。让这个人可以一键下单,在最近的一个咖啡馆买一个和昨天不一样口味的咖啡。
这个例子当中,事物XXX就是这个人的习惯。机器通过学习这个人买咖啡的数据,总结出来了一个规律,从而产生了这个自动推荐这个人买咖啡的这个算法。由于这个算法是按照这个人的习性总结出来的,很大程度上这个算法可以提高这个人下午喝咖啡的效率。尽管这是一个非常简单的例子,很多人一眼就看出来了。我还是相信有很多的秘书未必能总结出这个规律,主动的帮老板提高喝咖啡的效率。
另外,机器学习并不止步于此。她的魅力还在于她可以逐步的改善她的算法。如果,有一天你拒绝了她的推荐,她可以记住这个数据,并且逐步的调节她的算法。在事物演变的同时,他们也可以自主的演变他们产生的算法。
在这一个过程中,人类不再主动的产生具体算法。而是训练机器去通过学习数据,总结提炼算法。由于机器天生比人类拥有更好的记忆力和运算能力,他们产生的算法的速度和复杂程度会在不同的维度上突破之前我们人类产生的算法。从这个角度出发,为了更好的在未来充满机器学习的社会生存,我们必须要做好两件事情。
一,充当好训练师的角色,寻找更好的训练机器学习的方法。
二,产出更好的数据,以便于更好的训练机器。
那么如何做到这两点呢?且听下回分解。
首发平台:
qrcode_for_gh_e4011e3ed86c_258.jpg© 版权声明:本文首发自本人微信公共帐号:思故是(sikaoguwozai);无需授权即可转载,但转载时请务必注明作者 。
网友评论