高斯混合模型(Gaussian mixture model,GMM)是常见的一种概率模型类统计学习方法,它通过样本的概率密度分布估计来解决数据样本的聚类问题,在生物学统计与医学统计领域有着广泛的应用。本节将向大家介绍在 Python 中如何利用 Scikit-Learn 库中的相关工具构建高斯混合模型,以及这个模型在 Python 中使用的相关技巧。
首先,我们需要导入相关的可视化以及运算工具库,并构建示例数据:

对于构建好的示例数据,我们先运用前几章谈到过的 K-Means 算法进行聚类,效果如下:


为了清晰描绘聚类结果,我们导入 scipy 中的 cdist 工具,构建函数 plot_kmeans 用于刻画出每个聚类簇的大致边界:



未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/147
更多课程和文章尽在微信号:「datartisan数据工匠」

网友评论