数据智能:未来商业的核心
先透露一个阿里的小秘密,大家都可能经历过每年双十一的狂欢,过去七年双十一的成交额都在创纪录,去年超过了1200亿人民币。
但是你可能不知道的是过去七年,每年的双十一,阿里巴巴的大部分人要做的事情却越来越少,甚至有越来越多的阿里同学会发现那天根本无事可做。我们客服曾经是压力最大的部门,去年破天荒第一次不用加班。
原因是什么呢?因为在这一整天里客户该看到什么产品,他们挑选了什么产品,他们的收藏夹里选了什么产品,下次他们再登录淘宝该给他们推荐什么商品,这些过程完全都是由机器自动完成。去年80%的客户服务是通过机器人完成的,不再是人工服务。
其实不光是双十一,每一天大家表面上看到的淘宝是一个网站,但是它最核心的其实是一个巨大的搜索和推荐引擎,让每一个人上来都能得到个性化的服务。
每天上亿人在淘宝挑商品、做买卖,这些个性化的服务如果都由人来完成,那么淘宝雇再多的人无济于事。 这就是我们这个时代第二个最重要的特征,由机器取代人进行决策、提供服务。越来越多的场景只有靠机器、靠人工智能才能完成以前靠人没有办法完成的海量服务和个性化的服务。
淘宝的核心推荐引擎就是人工智能的运用,它由很多种复杂的算法糅合在一起,每天进行海量数据的自动处理。它是一个庞大的机器集群,不仅仅是一批人,更重要的是有一个巨大的人工智能的支持,才能完成大家今天体验到的这些服务。
这两年大家才开始听到大数据、人工智能这些热门得不能再热门的词,但实际上认真想一下,互联网最成功的这几家企业,本质上都是基于人工智能和大数据。你在谷歌上输入任何一个关键字,不到一秒的时间,它就能把全网相关的信息推送给你,这完全是超出人的想象的一种服务,只有靠机器才能做到。
未来商业会全面智能化
什么叫智能化呢?就是未来商业的决策会越来越多地依赖于机器学习,依赖于人工智能。 机器将取代人,在越来越多的商业决策上扮演非常重要的角色,它能取得的效果远远超过今天人工运作带来的效果。
当然大家可能对于人工智能的发展未来有很多种不同的理解,这是一个相对来说比较新的领域。
随着AlphaGo在最古老的围棋上面打败了人类,人工智能的概念今天已经非常普及了,人工智能毫无疑问是未来最重要的一个趋势。当然对于人工智能未来的技术变化有很多种不同的观点和争论,比如说人工智能到底能不能够在根本上取代人,挑战人的存在,或者退一步,人工智能在多大程度上可以像人一样思考。
今天人工智能的技术核心,其实是机器用笨办法去算,它的所谓学习是通过概率论的方法,不断地去通过正反馈来优化结果,而不是像人一样去思考和学习。这种机器学习的方法必须基于海量数据的校验,必须基于算法的一个不断反馈过程。 所以我把这个阶段人工智能带来的商业价值,它所实现的路径叫做数据智能。
因为到今天为止小孩是怎么学语文的,小孩是怎么学会算法的,这些东西我们都没有任何理解,更谈不到把这种理解变成机器可以去实现的智能。所以我们今天在看得见的未来,这也许是5年、也许是10年,甚至更长一点的时间内,我们讲到的人工智能都是机器智能,是机器基于海量数据能够快速迭代优化,做到比人更好的效果。
最近最典型的案例就是谷歌翻译。传统上我们想用人的学习方法去做翻译,机器怎么都做不过人,但是过去十几年用所谓的深度学习方法,其实就是机器智能的方法。通过所有的人提供海量的数据,机器现在能够快速提高它的准确率,从几年前百分之四五十,快速提升到今天百分之九十几以上,完全能够达到商用的水平。
所以谷歌翻译成了今年非常热门的一项服务,越来越多的基于机器智能的服务,会成为我们生活中离不开的服务,它的本质是用机器做到了人做不到的事情。
接下来你大概就想知道这个看起来很高大上的叫做数据智能的东西,要怎样才能融入到具体的商业里面去呢?
数据化、算法化和产品化
简单来说,就是要做数据化、算法化和产品化这三件事情。先讲数据化的概念。 由于互联网的存在,由于广泛的连接,淘宝其实是能够准确地记录下来所有用户全部的在线行为的,而这些数据本身可以用于优化他下一次来淘宝的体验,所以没有这个数据化的积累就没有后面的一切。
第二个算法化。 算法这个词可能一般的人听了会懵,其实讲算法之前先要讲一个概念叫建模型。一个人在某个场景下会怎么决策,先要把他抽象成一个模型,然后要找到一套数学的方法,让它能够收敛,用模型去优化他的决策。然后第三步才是把这个算法用计算机能够理解的程序写下来。
大家一般讲的算法是指第三步,用代码写下来的一套回归的程序。但它前面有两个关键的概念, 一个是建立模型,第二个是这个模型要用某种数学方法解决,能够得到一个可以收敛的结果。然后第三步才是计算机的程序。 算法可能是这个时代创造巨大价值的一个新概念,值得展开讲。
我们还是回到历史上最出名的一个算法叫做PageRank,这个算法支撑了谷歌这个5000亿美金公司的起步。想想看我们一开始讲到的那个案例,你上网在一个搜索框输入一个关键字,全网的信息就能按照关联度推荐给你。
怎么组织全网这个信息?怎么去理解相关性?怎么把最相关的信息给你推送出来?谷歌最早的创始人在斯坦福读博士的时候就想到了一种模型,这个模型根据网站跟网站之间的链接和指向,来代表这个网站的相对重要性。然后他把所有网站的链接都记录下来,这就完成了数据化。但更大的挑战是你怎么来算它的相关性?他就设计了一套算法,一套数学的公式,这个相关性就是根据这个公式来推导的。
然后才是第三步,由于计算能力的大发展,能够把全网的数据都通过这个数学公式马上计算出一个结果。你输入关键字,通过了这个巨大的搜索引擎,实际上它的核心就是这个算法,就能给你一个特定的结果,这就是算法起的作用。
算法要真正发生作用,离不开第三个关键的词,就是产品化,你一定要建立产品跟客户的直接连接。 这个产品在我们刚才讲到的搜索案例,就是搜索结果页,更完整地讲是一个搜索框加上你看到的那个搜索结果。
搜索结果页这个产品建立了智能引擎和用户之间互动的桥梁,你的每一次点击,你看了这个搜索结果之后你是点了第一条还是第三条,还是甚至翻到了第五页。用户的行为通过数据化的方式告诉了这个机器智能的引擎说,你给我的结果相关性够不够高,智能化程度够不够高,机器再根据这个结果去优化它的算法,给出一个更好的结果。
但是机器跟人不一样,它可以永远不知疲倦的24小时以秒级的速度在更新它的结果,所以它的进化速度非常非常快,从一个开始并不很精确的结果,很快就能达到一个非常精确的结果。产品化是非常重要的一个环节,因为它提供了一个反馈闭环,而反馈闭环是任何学习的一个前提条件。
反馈闭环这个词用得稍微有点专业,但实际上大家都有非常深刻的切身体会。你无论学什么,比如说学打羽毛球,你动作对不对,一定要教练给你一个反馈,你改了以后是往正确的方向更对了,还是纠偏纠得更错了,教练要再给你一次反馈。这实际上就是学习、修正、调整、反馈。过程中你就能够学习、进步、提升,人是这么学习的,机器也是这么学习的。
机器能够有智能的唯一原因,就是笨机器用笨方法学,但是因为它计算能力强,数据量足够大,最后可以比人更快速地达到一个效果的优化。 通过数据算法和反馈闭环,机器就能学习,机器就能进步,机器就能拥有智能,而商业就能够实现智能化升维。
看到这里你可能会有点担心,说我是一个很传统的企业,那些算法我也不懂,海量的数据计算我也不懂,那么多数学天才我到哪儿去找?
实际上对于大部分的传统企业来说,你不用担心这些。就像云计算,谷歌、阿里巴巴、亚马逊这些企业都在把它当成一个公共服务在提供,所以将来你不用去担心算法、计算这些,这些都会成为智能时代的基础设施。
你要做的是什么呢?你怎么赶上这个智能化的浪潮?其实核心在于你能不能够创新地实现产品化,把你的核心业务流程在线化,这样的话数据才能被记录下来。然后你可以在这些大互联网企业提供的算法工具包里,去挑一个合适你的算法。 三位一体,产品提供反馈闭环,数据作为原料,交给算法去处理,你的业务就变成了一个智能业务。 你就能比你的竞争对手每天都越跑越快。这是未来竞争能够脱颖而出最重要的一个秘诀。
今日小结
这一讲的核心是机器智能将推动绝大部分的商业快速智能化,这将决定大部分企业的未来生死。而实现机器智能的核心是创造性得把你的核心业务在线化,从而实现数据化、算法化和产品化的三位一体,让你的商业拥有数据智能这一核心引擎。
这一讲的内容就到此结束。第三讲我们将通过几个关键案例的讨论,让大家更深刻地理解前面两讲的核心概念。
网友评论