numpy实现朴素贝叶斯模型（高斯分布）

作者: 司马山哥 | 来源:发表于2020-08-16 14:14 被阅读0次

决策树和朴素贝叶斯
numpy实现朴素贝叶斯模型（高斯分布）
深度学习知识点汇总-机器学习基础（6）
朴素贝叶斯法
Task5 朴素贝叶斯、SVM、LDA主题模型
朴素贝叶斯(NBM)之后验概率最大化的含义 | 统计学习方法
机器学习数学原理（4）——朴素贝叶斯模型
朴素贝叶斯概述
第五周 - 20180507
朴素贝叶斯

第一次尝试用面向对象的方式构建函数，写了一个GaussianNB类，完善了拟合、预测函数。

import numpy as np


class GaussianNB():

    def fit(self, X, y):
        """模型拟合"""
        self.y_prior = [round(sum(y == i) / len(y), 6) for i in sorted(set(y))]
        self.features_param = []

        for i in sorted(set(y)):
            pos = np.where(y == i)
            features_data = X[pos]
            features_mean = np.mean(features_data, axis=0)
            features_std = np.std(features_data, axis=0)

            param = [(round(avg, 6), round(std, 6)) for avg, std in zip(features_mean, features_std)]
            self.features_param.append(param)

    def predict(self, x):
        """模型预测"""
        result = []
        for i in range(x.shape[0]):
            bayes_prob = []

            for j in range(len(self.y_prior)):
                x_param = self.features_param[j]
                y_param = self.y_prior[j]
                xi_conditional_prob = 1

                for k in range(len(x_param)):
                    xi_conditional_prob *= self.gauss_pro(x[i][k], x_param[k][0], x_param[k][1])
                bayes_prob.append(round(y_param * xi_conditional_prob, 6))
            result.append(np.where(bayes_prob == np.max(bayes_prob))[0][0])

        return np.array(result)

    def gauss_pro(self, v, miu, sigma):
        """高斯分布概率密度计算"""
        part1 = 1 / (sigma * np.sqrt(2 * np.pi))
        part2 = np.exp(-1 * (v - miu) ** 2 / (2 * sigma ** 2))
        return round(part1 * part2, 6)


if __name__ == '__main__':
    from sklearn import datasets

    iris = datasets.load_iris()
    X = iris.data
    y = iris.target

    gnb = GaussianNB()
    gnb.fit(X, y)

    res = gnb.predict(X)
    print(res)