为什么叫朴素贝叶斯分类呢?
1.它用到了贝叶斯定理
2.这种方法的思想真的很朴素🐒
对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。你在街上看到一个黑人,你很可能会猜非洲。因为黑人中非洲人的比率最高,当然也不一定对。但在没有其它可用信息下,我们会选择条件概率最大的类别,这就是朴素贝叶斯的思想基础。
举个栗子🌰:
用cu,fe,ca三种元素的含量判断某人是否患病。
可以先统计1000人的患病情况,并测出他们的三种元素含量。
若其中400人患病,那p(患病)=0.4,p(健康)=0.6
患病的400人中:
p(cu>0.1)=0.8, p(cu<0.1)=0.2,
p(fe>0.1)=0.7, p(fe<0.1)=0.3,
p(ca>0.1)=0.6, p(ca>0.1)=0.4,
健康的600人中:
p(cu>0.1)=0.3, p(cu<0.1)=0.7,
p(fe>0.1)=0.2, p(fe<0.1)=0.8,
p(ca>0.1)=0.1, p(ca<0.1)=0.9,
那么我们就可以计算其他人的患病概率了:
加入一个人cu,fe,ca三种元素含量分别为0.12,0.8,0.7
那他的p(患病)=0.4*0.8*0.3*0.4=0.0384
p(健康)=0.6*0.3*0.8*0.9=0.1296
可以看出,他的p(健康)明显大于p(患病),所以很可能是健康的
网友评论