昨晚加今早看了朴素贝叶斯算法相关,终于在阮一峰前辈的博客帮助下理解了。顺便给个记录
reference:
贝叶斯推断及其互联网应用(一):定理简介
朴素贝叶斯分类器的应用
1.朴素贝叶斯解决的是什么问题
在包含一系列特征值和与之对应的目标值数据样本的基础上,需要判断新来的拥有一些特征值的数据,属于哪一类目标值。举个例子: 人体数据样本
上图包含了一些人体信息,特征值包含:身高,体重,脚掌。而目标值分类有两个:男/女。
问题:在已知上述数据的前提下,给出一个数据:已知某人身高6英尺、体重130磅,脚掌8英寸,请问该人是男是女?
2.问题分析
上述问题,实际上是条件概率问题,即在已知了这个人的身高体重等数据(特征)条件基础上,判断该人属于男人还是女人(当然是分别计算是男性\女性的概率,那个概率大,就认为是哪个)。即求------P(男性还是女性|已知身体特种数据)
已知贝叶斯定理:
贝叶斯公式:
贝叶斯公式
上面公式中,要求量位左边值,而等号右边值的分母已知,现在就要求分子。而分子由朴素贝叶斯的假定各个特征独立可得到如下推论————
(朴素贝叶斯假定每个特征彼此独立)
image.png
上述中,C应该是每一个目标类型值。即我们应该计算每一个C对应的上式结果,然后比较P(C1|F1F2...Fn)、P(C2|F1F2...Fn)、、、P(C¡|F1F2...Fn)中,哪一个C对应的结果大,那么这个事件的预测值分类就是该C对应的分类。
3. 注意事项
(1)朴素贝叶斯,“朴素”在了哪里?
全概率公式
因为现实生活中的每一个特征可能都是有关联的,而不是相互独立的,而朴素贝叶斯算法则假定每一个特征都是相互独立的。这就是“朴素”的含义。
(2)全概率公式:
网友评论