已知某条件概率,如何得到两个事件交换后的概率,也就是在已知 P(A|B) 的情况下如何求得 P(B|A)。
- 前提条件是特征之间独立
- 如果特征值是离散的值,需要考虑拉普拉斯平滑,解决出现 0 次的问题。
- 如果特征值是稀疏的离散值,可以假设服从伯努利分布
- 如果特征值是连续值,则可以假设服从高斯分布
对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别
- 版本1
- 版本2
- 如果特征是数值的,最好是正态分布的数值的,那么用 sklearn.naive_bayes.GaussianNB
- 如果特征是binary的,那么用 sklearn.naive_bayes.BernoulliNB
如果特征是categorical的,那么用 sklearn.naive_bayes.MultinomialNB
参考链接
https://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html
https://www.cnblogs.com/pinard/p/6069267.html
网友评论