美文网首页
朴素贝叶斯

朴素贝叶斯

作者: 快乐的小飞熊 | 来源:发表于2017-02-27 00:06 被阅读0次

    1.思路:
    给定训练集后,假设特征之间都是互相独立的。
    (1)计算输入输出的联合概率分布
    (2)对于给定的输入x,利用贝叶斯原理求出后验概率最大的输出y

    2.优缺点:
    优点:
    (1)学习和预测的效率高,模型简单,且易于实现;在数据较少的情况下仍然有效,可以处理多分类问题;
    (2)对缺失数据不敏感。
    缺点:
    (1)分类效果不一定很高,特征独立性假设会是朴素贝叶斯变得简单,特征独立在实际应用中往往不成立,所以会牺牲一定的分类准确率,在属性个数多并且相关性强的时候,朴素贝叶斯的分类效率不如树模型;
    (2)需要已知先验概率

    3.原理:
    对于输入空间x为n维向量的集合:
    ![][01]
    [01]:http://latex.codecogs.com/png.latex?x:(x_1,x_2,x_3,...,x_n)
    输出空间c的标签集合为:
    ![][02]
    [02]:http://latex.codecogs.com/png.latex?c:(c_1,c_2,c_3,...,c_n)

    假设X是定义在输入空间上的随机变量,C是定义在输出空间上的随机变量,则X和Y的联合概率分布为:
    ![][03]
    [03]:http://latex.codecogs.com/png.latex?P(X,C)
    朴素贝叶斯法通过训练数据集学习联合概率分布,学习联合概率分布主要是得到先验概率和条件概率分布。
    先验概率分布:
    ![][04]
    [04]:http://latex.codecogs.com/png.latex?P(Y=c_k),k=0,1,2...
    条件分布概率为:
    ![][05]
    [05]:http://latex.codecogs.com/png.latex?P(X=x|Y=c_k)
    即可得后验概率分布,如下图所示:

    Bayes_rule.png

    相关文章

      网友评论

          本文标题:朴素贝叶斯

          本文链接:https://www.haomeiwen.com/subject/lguawttx.html