【书籍/课程名称】马尔可夫模型
【类型】书籍目录框架/课程框架
【关键词】
* 马尔可夫模型,转移概率,统计均衡,佩龙-弗罗宾尼斯定理,销量-耐久性悖论,马尔可夫决策模型,行动与状态改变,推迟满足感
【摘要】
* 马尔可夫模型用来刻画以一定概率在一组有限的状态之间不断转换的系统。
* 任何一个马尔可夫模型,只要状态集是有限的、不同状态之间的转移概率是固定的、在一系列转移后能够从任何一个状态变换为任何其他状态,而且状态之间不存在固定的循环,就必定会收敛到唯一的统计均衡(statistical equilibrium)。
* 在统计均衡中,单个实体可以继续在各种状态之间移动,但是各种状态之间的概率分布仍然是固定的。
【一、佩龙-弗罗宾尼斯定理】
* 佩龙-弗罗宾尼斯定理(Perron-Frobenius Theorem):一个马尔可夫模型必定收敛于一个唯一的统计均衡,只要它满足如下四个条件:
* 状态集有限:S={1,2,…,K}。
* 固定转换规则:状态之间的转移概率是固定的,即在每个周期中,从状态A转换为状态B的概率总是等于P(A,B)。
* 遍历性(状态可达性):系统可以通过一系列转换从任何状态到达任何其他状态。
* 非循环性:系统不会通过一系列状态产生确定的循环。
* 如果满足这四个假设,那么改变初始状态、历史和干预措施,都不能改变长期中的均衡。
* 需要强调的是,从佩龙-弗罗宾尼斯定理中得出的结论不应该说明历史是不重要的,而应该是:如果历史确实是重要的,那么必定会违背模型的其中一个假设。
* 有两个假设,即状态集有限和非循环性,几乎总是成立的;遍历性通常也能成立;状态之间的转移概率是固定的这个限制是最有可能被违背的假设。因此,这个模型表明,如果历史确实是重要的,那么必定存在某种潜在的结构因素改变了转移概率(或者改变了状态集)。
* 改变家庭状态的政策干预措施,例如旨在帮助成绩落后的学生的特殊帮扶计划,或者食物募捐活动,只能在短期内带来改善,不会改变长期均衡。相比之下,提供资源和培训,以提高人们保住工作的能力,进而减少从就业变为失业概率的干预政策则有可能会改变长期结果。
* 马尔可夫模型为我们提供了一些术语,使我们能够理解状态与转移概率之间的区别。它告诉我们一个基本道理——与其改变当前状态,还不如改变结构因素,而后者更有价值。
* 销量-耐久性悖论(sales-durability paradox)说的是,产品或创意的流行程度与其说取决于它们的相对销量,不如说取决于它们的耐久性。销量-耐久性悖论背后的逻辑,也可以用来解释市场份额与品牌忠诚度(某人改用其他品牌的产品的可能性)之间的正相关关系。
【二、模型应用】
* 【应用举例】
* 我们可以用马尔可夫模型来对四种核酸之间的遗传漂变进行建模分析。
* 我们可以用马尔可夫模型对身体健康演变的轨迹进行建模,那些能够产生更好均衡的健康干预措施是值得追求的。
* 马尔可夫模型还可以用于识别国际危机的不同模式,并能够用于区分会导致战争的过渡与会带来和平的过渡。在这个领域的应用要求我们估计两种不同的模型,如果这两个模型中的转移概率有显著差异,那就可以对现有的各种模式进行比较,然后看哪个过程对数据的拟合更优。
* 这种通过马尔可夫模型将不同模式区分出来的方法,还可以用来辨别书籍或文章的作者。
* 网页排名可以看作随机游走与马尔可夫模型的组合。如果将网页排名视为一种算法,就会发现可以用它来生成任何网络的排名。
* 【适用边界】
* 在应用马尔可夫模型解释现象或预测趋势时,建模者对状态的选择至关重要,状态的选择决定了这些状态之间的转移概率。
* 无论对状态的选择如何,如果四个假设都成立(关键检验将为转移概率是不是能保持不变),那么系统将会存在一个唯一的统计均衡。系统状态的任何一次性变化都最多只能产生一些暂时性的影响。
* 那些试图通过为期只有一两天的活动来激发学生学习兴趣的做法,可能不会产生什么有意义的影响。与此类似,进入社区“送温暖”、来到公园“捡垃圾”的志愿者也可能无法带来什么长期收益。任何一次性的资金涌入,无论其规模大小,影响都会消失,除非它改变了转移概率。
* 马尔可夫模型是通过区分以下两类政策来指导行动的:一类政策能够改变转移概率,而改变转移概率可以产生长期影响;另一类政策只能改变状态,并且只能产生短期影响。如果转移概率无法改变,那么我们必须定期重置状态才能改变结果。
* 并不是每个动态系统都满足马尔可夫模型的假设。在不满足马尔可夫模型假设的情况下,历史、干预政策和事件都可能会产生长期影响。
* 例如,在波利亚过程中,结果改变了长期均衡。对系统的重大干预或冲击可能会改变转移概率甚至是整个状态集。
* 蒸汽机、电力、电报或互联网等重大技术变革,改变了经济的可能状态集。重新界定权力架构或制定新政策的政治和社会运动,也会改变状态集。
* 因此,我们也许更应该将历史视为一个马尔可夫模型序列,而不是视为一个向不可避免的均衡方向发展的过程。
【三、马尔可夫决策模型】
* 马尔可夫决策模型(Markov decision model)是对马尔可夫模型的一种修正,方法是将行动包括进来,行动会带来回报,而回报则以状态为条件,还会影响状态之间的转移概率。
* 考虑到行动对转移概率的影响,最优行动并不一定是能够最大化即时回报的那个行动。(推迟满足感)
* 将一个决策问题表达为一个马尔可夫决策模型,可以告诉我们更好的行动是什么。通过考虑行动对状态的影响,我们会做出更明智的选择。
* 晚睡与早起和锻炼相比,会产生一个更高的直接回报,购买昂贵的咖啡比自己动手制作咖啡产生更高的回报。然而,从长远来看,我们可能会更乐于坚持锻炼和节省咖啡钱。
* 我们总能找到一对相反的谚语。通过将我们的选择嵌入马尔可夫决策模型中,可以使用逻辑来确定在给定的情境下,哪些常识性的建议真的有用。
【四、认知升级】
* 与其改变当前状态,还不如改变结构,而后者更有价值。
* 模型都不一定能给出准确的答案。但是,这些模型确实生成了知识。我们要依靠自己的智慧做出判断:对这个模型与其他模型或直觉结论,该如何进行权衡。
网友评论