接下来可能慢慢进入了机器学习的旅程,可能要面临更大的跳转,希望坚持。
读计算机专业的学生都知道,贝叶斯定理不陌生,是我们大学的概率论统计学里第一章就学习的东西,可想而知,这定理是有多重要。
咱们先来惠顾一下贝叶斯定理如何推理出来的。
由于贝叶斯公式是由全概率公式和乘法公式得到的,所以我们先看看全概率公式和乘法公式。
全概率公式
- 如果事件组B1,B2,。。。满足1.B1,B2。。。。两两互斥,即 Bi ∩ Bj = ∅ ,i≠j , i,j=1,2,。。。,且P(Bi)>0,i=1,2,....;
2.B1∪B2∪。。。=Ω ,则称事件组 B1,B2,。。。是样本空间Ω的一个划分
设 B1,B2,。。。。是样本空间Ω的一个划分,A为任一事件,则:
因乘法公式是由条件概率公式可得,所以
条件概率
设A,B是两个事件,且P(B)>0,则在事件B发生的条件下,事件A发生的条件概率(conditional probability)为:
P(y|x)=P(xy)/P(x)
乘法公式
1.由条件概率公式得:
P(xy) = P(y|x).P(x) = P(x|y).P(y)
贝叶斯公式
由全概率公式和乘法公式可得
垃圾邮件分类
贝叶斯算法是监督学习,所以在以往的邮件来往中,有多少正常邮件和垃圾邮件已做过统计
问:如果来一封新的邮件,如何判断是什么邮件,垃圾邮件?正常邮件?
![](https://img.haomeiwen.com/i12519225/9e16697815c5c272.png)
比如咱们用判断该邮件是否是广告邮件即为垃圾邮件。
![](https://img.haomeiwen.com/i12519225/e5a2040de896cd3e.png)
加油鸭,希望就在前方。
网友评论