机器学习朴素贝叶斯—Apple的学习笔记
用数学公式来表述贝叶斯定理:
P(c∣x)=P(c)P(x∣c)P(x)=P(x,c)P(x)P(c∣x)=P(c)P(x∣c)P(x)=P(x,c)P(x) P(c|x)=\frac{P(c)P(x|c)}{P(x)}=\frac{P(x,c)}{P(x)}P(c∣x)=P(x)P(c)P(x∣c)=P(x)P(x,c)
c表示的是随机事件发生的一种情况。x表示的就是证据(evidence)\状况(condition),泛指与随机事件相关的因素。
P(c|x):在x的条件下,随机事件出现c情况的概率。(后验概率)
P©:(不考虑相关因素)随机事件出现c情况的概率。(先验概率)
P(x|c):在已知事件出现c情况的条件下,条件x出现的概率。(后验概率)
P(x):x出现的概率。(先验概率)
接着就是解析公式,变成条件概率的计算。最后按特征来判断分类的概率,哪个概率大,就判断为哪类。
提升贝叶斯表现
1. 如果连续型数据但是不满足正态分布,则将其转化为符合正态分布的数据
2. 如果测试数据特征出现频率为0的数据,就用平滑技术“拉普拉斯变换”来进行预测
3. 删除相关联的特征,可能造成过拟合
4. 注意各个参数选项的影响,建议在数据与处理和特征选择阶段处理参数问题
5. 集成、提升、装袋方法由于目的是减小方差,所以对于朴素贝叶斯没有任何帮助
参考
https://blog.csdn.net/amds123/article/details/70173402
https://www.cnblogs.com/csguo/p/7804355.html
https://blog.csdn.net/assassinangjie/article/details/78303255
网友评论