2020 机器学习之图模型(1)

作者: zidea | 来源:发表于2020-01-09 20:04 被阅读0次
machine_learning.jpg

图模型

用图模型来重新解释一下朴素贝叶斯和隐马模型
我们先简单介绍一机器分类

联合概率

如果我们知道P(A,B,C)的联合分布我们就可以回答任何关于 A,B 和 C 的概率的问题。我们就可以得到P(A|B) P(B) P(C|AB)。
不过问题就是如果我们并不连接这些变量(A B C) 之前关系,我们联合变量的计算量会随着变量增加成指数级增加的。
这里假设我们有 A B C 三个变量他们取值分别可能是 1 或 0,那么我们就 7 排列组合

A B C
0 0 0
0 0 1
0 1 0
1 0 0
1 1 0
1 1 1
1 0 1

所以当我们不知道 A B 和 C 之间的关系我们需要 7 数来学出联合概率。那么这个 7 怎么来的2^3 - 1 = 7 。那么如果我们有 30 变量我们就需要2^30 - 1 数,这样计算量远远超出计算能力。现在我们还只是2维变量。这也就是维度问题,我们需要图模型来解决维度问题。

如果我们知道变量之间关系,这样就可以将指数复杂度压缩为多项式复杂度,其实有关图模型的本质也就是我们人为地为假设或建立一下变量间的关系从而降低模型复杂度。不过图模型根据建模者有很大关系,


001.png

有向无环图模型

事件 依赖事件
E C
C A,B
D A

P(A,B,C,D,E) = P(A)P(B)P(D|A)P(C|A,B)P(E|C)
下面公式就是根据上面例子我们推导出来一个图模型中联合概率公式
p(x_1,x_2,\dots,x_n) = \prod_{i=1}^n p(x_i|parent(x_i))

现在图像模型主要应用就是医院的临床诊断。BI 中也会引用,还有制药根据DNA 中也会用到。

经典实例

这里有 4 个事件分别是

  • Cloudy(多云)
  • Sprinkler(喷水灌溉)
  • Rain(雨天)
  • WetGrass(草湿润)

我们来描述一下他们之间关系,Cloudy(多云)可能会影响到Sprinkler(喷水灌溉)和Rain(雨天) 随后我们就用事件的首字母来表示这样简便一些。W可能是因为喷水器和下雨。喷水器受到多云影响,如果是多云可能不喷水了,而下雨也是和多云有关系。现在大家可能已经清楚他们之间相互的关系。

我们通过观察获取数据然后进行统计来得到下面概率,不用记录2^4 -1 概率,因为我们已经知道这些变量之间关系,

002.png
  • 某一天是多云概率
P(C=F) P(C=T)
0.5 0.5
  • 喷水概率P(S|C)
C P(S=F) P(S=T)
F 0.5 0.5
T 0.9 0.1
  • 下雨概率P(R|C)
C P(R=F) P(R=T)
F 0.8 0.2
T 0.2 0.8
  • 草湿概率P(W|R,S)
S R P(W=F) P(W=T)
F F 1.0 0
T F 0.1 0.9
F T 0.1 0.9
T T 0.01 0.99

p(C,S,R,W) = P(C)p(S|C)p(R|C)p(W|S,R)

已经建立好�模型,也就是有了联合概率公式我们现在用这个模型干些什么呢?我们开始求P(S=T)也就是开启喷水器的概率是多少。我们可以通过积分将不需要变量积掉。

p(S=1) = \sum_{c=0}^1 \sum_{r=0}^1 \sum_{w=0}^1 p(C,R,W,S=1)

p(S=1) = \sum_{c=0}^1 \sum_{r=0}^1 \sum_{w=0}^1 p(C)p(S=1|C)p(R|C)p(W|S=1,R)

这里我们用数字 1 表示 T

\begin{aligned} = p(W=0|S=1,R=0) p(S=1|C=0)P(R=0|C=0)p(C=0)\\ + p(W=1|S=1,R=0) p(S=1|C=0)P(R=0|C=0)p(C=0) \\ + p(W=0|S=1,R=1) p(S=1|C=0)P(R=1|C=0)p(C=0) \\ + \cdots \\ \end{aligned}
通过写三层for循环这样我们问题就变得复杂度。这是我们就可以动态规划,

p(S=1) = \sum_{c} \sum_{r} \sum_{w} p(C)p(S=1|C)p(R|C)p(W|S=1,R)
\begin{aligned} = \sum_c \sum_r p(C)p(S=1|C)p(R|C) \underbrace{\sum_w p(W|S=1,R)}_{(1)} \\ = \sum_c p(c) p(s=1|c) \underbrace{\sum_R p(R|C)}_{(2)} \\ = p(s=1|c=0)p(c=0) + p(s=1|c=1)p(c=1) \end{aligned}

  1. \sum_w p(w|S=1,R) 这里对 w 进行求积分我们可以从表格可以看出这个积分应该是 1 所以这一项可以被消掉
wechat.jpeg

相关文章

  • 2020 机器学习之图模型(1)

    图模型 用图模型来重新解释一下朴素贝叶斯和隐马模型我们先简单介绍一机器分类 联合概率 如果我们知道P(A,B,C)...

  • 机器学习之Validation(验证,模型选择)

    机器学习之Validation(验证,模型选择)

  • 2020机器学习 Transform 模型(1)

    首先感谢李宏毅老师的分享,让我受益匪浅。部分图片也直接引用李宏毅老师的ppt 截图 今天我们将介绍 Bert,那么...

  • 2020机器学习线性模型(1)

    线性模型 今天我们来讨论一下线性模型,之前已经了解到线性模型来做回归问题,所谓回归问题就是根据给定样本数据训练出一...

  • 2020机器学习HMM模型(1)

    我们今天要介绍HMM(隐马可夫链),这是一个在深度学习,也就是循环神经网出现之前处理自然语言,特别是语音识别上一个...

  • 2018-10-28

    机器学习之Softmax回归模型 Softmax在机器学习中有非常广泛的应用,但是刚刚接触机器学习的人可能对Sof...

  • 6.machine_learning_Decision_Tree

    1 机器学习决策树 1.1机器学习中的决策树模型 ① 树模型不用做scaling ② 树模型不太需要做离散化 ③ ...

  • 周记:2019年第50、51周(12.9-12.22)

    1 工作: 查资料,看文献,写报告 2 学习: 《百面机器学习》ch6,概率图模型,之前没看过这部分内...

  • 1 Introduction and Motivation

    1 什么是机器学习 机器学习:能从数据中自动提取有价值信息的算法设计。三要素:数据、模型、学习。模型(model)...

  • 概率图模型01 简介

    概率图模型01简介 前言 最近开始看《模式识别与机器学习》的时候,遇到了一些障碍,所以开始学习概率图模型,为了更好...

网友评论

    本文标题:2020 机器学习之图模型(1)

    本文链接:https://www.haomeiwen.com/subject/ylluactx.html