
朴素贝叶斯的思想就是,对于给出的几类,我们分别求出在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。比如我们看到一个黑人,我们可以大概率猜测他是非洲来的,当然他也有可能是来自美洲欧洲。

有x(a1, a2,..., am)这些属性的人,被归为y1的概率,被归为y2的概率,。。。被归为yn的概率。所有的都计算好了之后求出max就是我们归为这个类

如何算出P(y1|x)一直到P(yn|x)是我们要解决的问题,因为分母都相同,所以只需要比较出分子的最大值。 P(x|y1)*P(y1) = P(a1|y1)*P(a2|y1)*....*P(an|y1)*P(y1)
P(a1 = m|y1) = 所有被归为y1类并且a1这个属性是m的 / 所有被归为y1类的个数
其中P(y1) = 被归为y1类的个数/所有实验总个数
【总共有M种outcomes,1 , 2, 3,....., M,求p1, p2, .... pM
nm = #{i : Xi = m} 所有结果归为这个m类的个数
pm = nm / N = 归为这个类的个数 / 总个数】


网友评论