美文网首页
《智能时代》2:大数据和人工智能思维

《智能时代》2:大数据和人工智能思维

作者: 芦权 | 来源:发表于2018-03-28 20:47 被阅读40次

    2016年3月15日,Google的AlphaGo击败围棋高手李世石,这个事情引发了社会热议。乐观派认为,人类马上就会步入人机合一的社会,各种疾病被消灭,人类过上美好的生活;悲观派认为,机器智能马上会发展到远远高于人类智能水平,最后不受控制然后领导人类甚至消灭人类。

    有这些观点的,基本上是不明白机器智能原理,一些“文科生”想出来的。我们今天谈新的思维,就是要杜绝“文科生”逻辑。

    机器智能不是人的智能

    关于机器智能,并不是现在才有的,1950年图灵就在论文中提出过,就是我们熟知的“图灵测试”,1956年,罗切斯特、香农、麦卡锡、明斯基四个人开了一个“达特茅斯夏季人工智能研讨会”,正式提出了人工智能的概念。

    既然人工智能有这么长的历史,为什么这几年才成为热点?这源于近几年移动互联网的兴起,带动了数据量的暴涨。

    AlphaGo下围棋的原理并不是它会像人一样思考,其实它自己都不知道自己是在下棋。当然,它也不是用的所谓穷举法来计算,围棋的变化达10的170次方,这个数量比把宇宙中的每一个微观粒子再变成一个宏观宇宙,所有宏观宇宙的微观粒子之和还要多。用白话说就是无穷,计算机是永远无法算出来的。

    AlphaGo用的方式是用几十万张高手对弈的棋谱数据喂给机器,通过对这些棋谱的统计,这样,机器就知道哪一步是好棋,获胜的概率更高,人类的顶级棋手,一生也就不过学习了几千张棋谱。这样对比,人和机器的水平就差了一个数量级。从这里可以看出,机器智能,是基于数据量的一种统计的方法,和人类思考完全是两码事。

    确定性到不确定性

    在过去,人们普遍认为世界一切都是有规律的,这些规律都是确定的,牛顿用几个简单的公式,像力学三定律和万有引力定律,把宏观世界物质运动的规律都描述清楚了。焦耳用一个公式就说明了能量守恒的原理。

    现在微观世界,我们知道要想测量一个电子的位置,是测不出来的,因为测量自身这个动作就会影响到电子的位置。掷色子,到底哪个点数会朝上,同样是无法准确预测的。

    这样是否我们的世界又变成了不可知状态?

    并不是,我们虽然不知道电子的准确的位置,但是可以知道它在一定时间在核外空间各处出现的概率,因此科学家用一种密度模型来描述电子的运动。我们虽然无法准确预测色子哪个点位朝上,但是我们可以尽可能多的掷色子,然后统计各个点位出现的概率,最后我们大概可以知道平均每个点位出现的概率都为六分之一。

    我们都喜欢确定性的东西,不喜欢不确定性。而在智能时代,我们要主动拥抱不确定性。举一个生活中的例子,人们在坐飞机的时候,最担心的是航班晚点,航班晚点是由多种因素决定的,会涉及到天气、流量管制、军事活动、各种意外情况等。

    可以说,每一趟航班是否会晚点,是个不确定的事。但是把所有航旅数据汇聚到一起,这个不确定性就会大大的消除。

    2016年,全国民航运输机场完成旅客吞吐量10.6亿人次,飞机起落架次923.8万。这么大的数据,我们按照国内飞行次数、国外飞行次数、平均票价、总延误时间、平均延误时间、平均提前出票时间、起飞城市、抵达城市、航班延误时段最多的月份、日子和时间点这些数据维度看,就可以哪些航班在什么时间段更容易延误,所以,一趟航班的延误概率在数据拥有方看来,是相对确定的。那么保险公司就会对此设计相应的延误险,客户追求确定性的心态促使自己购买航延险,保险公司又利用客户对确定性的追求的心态,卖给了客户一份基本确定收益的延误险,那么客户一生无论买多少次航延险,都是没办法得到的赔偿大于自己支付的总保费的。

    如果航旅数据从每个消费者的某时间段的飞行次数、航空公司金银卡统计、最繁忙的月份乘机次数、一年内平均折扣、头等舱、商务舱、经济舱的乘机次数、出发城市和到达城市、航空公司偏好等这些维度加以统计,我们就可以知道一个消费者的消费水平,目的地偏好,工作性质等等。根据消费者的特点,就可以精准的推送相应的商业服务给每一个消费者。

    从因果关系到相关关系转变

    上周周末两天,我在上海接受一个二手车金融的专项培训。培训期间,来自台湾的裕隆金融老师作数据展示的时候,给出一个很有意思的数据,在所有的二手车贷款中,二手车抵押贷款的违约率要低于二手车消费贷。普遍我们的观念认为,一个人拿自己的车去抵押贷款出来,通常状况已经很不好了,因为抵押贷款只能贷到比车辆估值低很多的钱,而且利息高的吓人,就是民间的高利贷。而消费贷款不一样,利息相对低很多,客户通常还得过得了风控较严的准入标准。

    在场的很多家同行公司也纷纷表示各自所在的公司数据规律也是一样的,那就引起了很热烈的讨论。其实,直到最后,也没有个什么特别值得大家共同信服的原因。

    存在二手车抵押贷款违约率低于二手车消费贷款违约率这个“果”,人们自然就特别想找到它的“因”。

    2003年Google推出了根据网页内容安插广告的服务,根据直觉,我们会知道,在一个登山的网站上,投放登山装备的广告;在汽车论坛和相关网站上,投放汽车和汽车用品的广告,效果应该最好。

    这其实就是用了相关性的特点。

    但是,根据统计结果,Google也发现在一些看起来相关性并不明显的内容和广告的搭配,效果却非常好。比如:

    在碟片租赁和视频网站上,放上零食的广告;

    在咖啡评论和销售的网站上,放上信用卡和房贷的广告;

    在五金工具评论的网站上,放上快餐的广告;

    这些搭配,如果没有数据统计,我们是根本没办法知道的,即使知道了,也没办法从逻辑上推理出有说服力的原因来。

    这就是智能时代的特点,只问有没有相关性,不在乎因果关系。


    有了智能时代的思维方式,那么我们在未来该怎么做,明天接着谈。

    相关文章

      网友评论

          本文标题:《智能时代》2:大数据和人工智能思维

          本文链接:https://www.haomeiwen.com/subject/wizycftx.html