美文网首页
Hadoop:数值型数据的朴素贝叶斯分类

Hadoop:数值型数据的朴素贝叶斯分类

作者: Zeabin | 来源:发表于2019-07-14 17:19 被阅读0次

朴素贝叶斯分类器用在符号型数据上比较多,如何处理数值型数据能找到的资料比较少,《数据算法:Hadoop/Saprk大数据处理技巧》这本书简要介绍了如何处理数值型数据。

假设数据服从一定的分布,通常假设为高斯分布(正态分布),于是只需要从训练数据中计算出每一类每一维度的均值和方差,就可以估计给定任一数值的后验概率。

对于一条新的数据 x,x 的第 i 维上的数据在给定类别c_j时出现的概率:
P(x_i|c_j) = \frac{1}{\sqrt{2 \pi}\sigma_{ji}} \exp{(-\frac{(x_i-\mu_{ji})^2}{2\sigma_{ji}^2})} x 在给定类别c_j时出现的概率:
P(x|c_j) = \prod_{i=0}^d P(x_i|c_j) 预测 x 的类别为
j=\arg \max_j P(x|c_j) 使用Hadoop实现时可以分为3个Job:

  • Job1:计算均值
  • Job2:计算方差
  • Job3:预测

重点是前两个Job,预测的Job可以与前两个分离,保存计算的结果,实现一次训练,多次预测

相关文章

  • Hadoop:数值型数据的朴素贝叶斯分类

    朴素贝叶斯分类器用在符号型数据上比较多,如何处理数值型数据能找到的资料比较少,《数据算法:Hadoop/Saprk...

  • 朴素贝叶斯法

    朴素贝叶斯法 朴素贝叶斯法的学习与分类 朴素贝叶斯法的参数估计 朴素贝叶斯实现 高斯朴素贝叶斯实现 使用 skle...

  • 轻松带你搞懂朴素贝叶斯分类算法

    贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类...

  • 机器学习算法朴素贝叶斯分类

    贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类...

  • 监督学习之概率模型

    贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类...

  • 04 贝叶斯算法 - 贝叶斯网络

    01 贝叶斯算法 - 朴素贝叶斯02 贝叶斯算法 - 案例一 - 鸢尾花数据分类03 贝叶斯算法 - 案例二 - ...

  • 03 贝叶斯算法 - 案例二 - 新闻数据分类

    01 贝叶斯算法 - 朴素贝叶斯02 贝叶斯算法 - 案例一 - 鸢尾花数据分类 常规操作 基准模型方法 数据加载...

  • 朴素贝叶斯

    朴素贝叶斯 用处:朴素贝叶斯主要解决的是而分类的问题。 为什么叫朴素贝叶斯: 因为贝叶斯分类只做最原始,最简单的假...

  • 朴素贝叶斯法(NaiveBayes)

    朴素贝叶斯法(Naive Bayes) 朴素贝叶斯法是基于贝叶斯定力和特征条件独立假设的分类方法。 朴素贝叶斯法实...

  • 朴素贝叶斯(Naive Bayes)

    朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这...

网友评论

      本文标题:Hadoop:数值型数据的朴素贝叶斯分类

      本文链接:https://www.haomeiwen.com/subject/aimwxctx.html