期望值最大化

作者: 奚磊Morry | 来源:发表于2017-04-13 22:04 被阅读246次

    一,
    Expectation Maximization(EM)。这是今天各种机器学习算法重要的理论基础,也同时在管理学有着非常广泛的应用,并且能够指导现实生活。

    最大期望经常用在机器学习和计算机视觉的数据聚类领域。

    也许听起来略微专业了一些,那么下面这例子应该可以让你理解:

    比如说食堂的大师傅炒了一份菜,要等分成两份给两个人吃,显然没有必要拿来天平一点一点的精确的去称分量,最简单的办法是先随意的把菜分到两个碗中,然后观察是否一样多,把比较多的那一份取出一点放到另一个碗中,这个过程一直迭代地执行下去,直到大家看不出两个碗所容纳的菜有什么分量上的不同为止。

    EM算法就是这样,假设我们估计知道A和B两个参数,在开始状态下二者都是未知的,并且知道了A的信息就可以得到B的信息,反过来知道了B也就得到了A。可以考虑首先赋予A某种初值,以此得到B的估计值,然后从B的当前值出发,重新估计A的取值,这个过程一直持续到收敛为止。

    二,
    那么再举个栗子:我们想要解决凸函数空间上的一个最优化问题(比如抛物线就是一个凸函数,如图。机器学习,各种预测都是最优化问题。)
    做法:只要给出一个收益函数(也成为利润函数或者成本函数,因为利润的反面可以理解为成本。)

    在每一时刻,算出能够最大化利益(期望值)的方向,沿着这个方向走一小步,然后再从新的起点重复这个过程,不论从何处起始,最后一定能够达到收益最大的那个重点。

    这其实就是一个迭代的过程,一步比一步优化。在机器学习中,这个过程由计算机自动完成的。去年AlphaGo击败李世石赚足了热点也引发了激烈的讨论,其实它也是因为运用了相关的算法,最终能找到一步棋的最佳走法,人脑是很难对抗这样的对手的。

    三,
    也许现在还不足以让你了解期望最大化,那么接下来两个例子你就能了解了。

    比如,前段时间中国足球队在主场输给了小组弱旅叙利亚,又在客场输给了乌兹别克斯坦队,提前告别了俄罗斯世界杯。足球一直是中国人心中的痛,年年都报以希望,然后年年都以失望收场,每次黑中国队其实是爱的体现。然而经过两代人的努力,中国足球竟然会从亚洲强队变为亚洲软柿子。领导其实也很急,用了很多手段,不管是砸钱还是换帅都没什么用。如果运用期望最大化原则,只要教育部宣布,以后高考一半分数看文化课成绩,另一半看足球成绩,那么立刻到处都是踢足球的学生,包括父母会给孩子报很多的足球兴趣班,政府也会砸钱在足球上。

    这个就是提前设置了收益函数,整个社会变成了一个机器学习的系统,因此期望最大化会使全社会在足球方面自动优化,从而让足球成绩达到最大值。

    四,
    期望最大化原则同样可以运用到人际关系和组织内部上,期以不断完善达到最高收益。

    比方说一个人交朋友,刚开始可能有比较大的随意性,但是他内心有一个衡量标准(收益函数),也就是能最大化自己的收益。想像一下在你小的时候,如果你有很多玩具,而你有两个朋友,一个会借你的玩具,另一个则是拿自己的玩具跟你换,你会喜欢和谁玩呢?

    这其实就道出了人际关系的本质,价值交换。很多人总是误解了人脉的定义,以为靠着喝酒喝来的交情就可以获得真正的朋友,事实却不是这样的。别人愿意和你交往,一定是看到了你有交换的价值,不论是现在的价值还是认定你以后的价值,亦或者是感情上的价值。你可以观察一下自己现在的情况,即使是无意识的,你也会对那些对你好的人,能彼此产生“化学反应 ”的人,以及距离比较近(方便帮助你)的人有好感,久而久之这些就成了你的朋友,而其他人则渐渐淡出了你的生活圈。当然每个人内心的收益函数是不一样的。

    五,
    而对于组织,尤其是公司内部来说,这其实就是隐藏的激励模式。创始人会影响一个公司的风格,他定下一个什么样的价值观(收益函数),员工就会不自觉地去朝着收益最大化的方向。有一家大公司在制定年终奖的标准时,把员工的一半奖金和他对公司价值观的认可挂钩,那么之后你会发现这些员工的思维会有意无意地向公司的价值观靠拢。

    俗话说,兵熊熊一个,将熊熊一窝,团队的管理者就是所在团队的灵魂,他会将自己的价值观、行事风格影响团队中的每个人。因此有的团队雷厉风行,积极向上,而有的团队就很懒散,事不关己高高挂起,并且团队中的人其实性格都各不相同,却依然在团队这个环境下表现一致,这就是管理者的激励模式的结果。

    现在商业社会发展的非常迅速,基于用户的不同需求,每家公司的定位也不尽相同。Google从公司还小的时候,就给单元测试写得好的员工发奖,给代码经常出错的元惩罚,于是自然而然地发展成一家重视工程质量的公司。再如Facebook,它一开始就腔调产品的迭代速度,因此它就成为一家以产品(而非技术)驱动的公司。我们的创业者经常会陷入什么误区呢?就是有的公司一开始就给部门订销售指标,那么它就成为只盯着下个季度KPI的公司,如此短视是不会有长远发展的。

    有些公司的管理者,经常会对员工的表现不满意,因素有很多,但是他们常用的做法是批评和教育,可想而知效果并不好。不如设置一个好的收益函数,让员工不自觉地去调整行为以最大化自己的利益。

    不论你是公司的管理者还是员工,甚至只是针对个人以及人际交往,都可以运用这个原则。宇宙的演变遵循很多原则,期望最大化便是其中之一,有什么理由不好好运用呢?

    相关文章

      网友评论

        本文标题:期望值最大化

        本文链接:https://www.haomeiwen.com/subject/nysiattx.html