美文网首页
机器学习day15高斯混合模型

机器学习day15高斯混合模型

作者: rivrui | 来源:发表于2020-08-24 19:30 被阅读0次

K均值缺点

  • 需要人工预先设置K值,而且该值与真实的数据分布未必吻合
  • K值只能收敛到局部最优,效果受到初始值影响较大
  • 容易受到噪声影响
  • 样本点被划分到单一的类里面

高斯混合模型

高斯混合模型(Gaussian Mixed Model,GMM)也是常见的聚类算法。使用EM算法进行迭代计算。高斯混合模型假设了每个簇的数据符合正态分布(高斯分布),当前的数据分布就是各个簇的高斯分布叠加在一起。

当数据明显无法使用一个正态分布拟合的时候,这时候我们就需要推广到多个正态分布的叠加,然后进行数据的拟合,这就是所谓的高斯混合模型,即采用多个正态分布函数的线性组合进行数据分布拟合,理论上,高斯混合模型可以拟合出任意类型的分布。

高斯混合模型假设

我们假设同一类的数据符合正态分布,不同簇的数据符合各自不同的正态分布。
我们需要计算每个正态分布的参数,均值\mu_i和方差\sum_i。我们还为每个正态分布添加一个参数\pi_i代表权重,或者说生成数据的概率。
p(x)=\sum_{i=1}^K\pi_iN(x|\mu_i,\sum_i)
高斯混合模型是生成式的模型,例如,一种最简单的情况。存在两个一维正态分布的分模型为N(0,1)和N(5,1),权重分别为0.7和0.3。那么生成第一个数据点的时候,先按照权重的比例,随机选择一个分布,然后根据分模线参数进行随机生成,之后第二...,直到生成所有的数据点。

一般情况下,我们无法直接得到高斯混合模型的参数,而是观察一些数据点,给定一个大概的类别数量K,然后求出最佳的K个正态分布模型。因此,我们需要计算的是最佳的均值\mu,方差\sum和权重\pi

如果使用最大似然求解,必将极其复杂,因此我们使用EM算法。

相关文章

  • 机器学习day15高斯混合模型

    K均值缺点 需要人工预先设置K值,而且该值与真实的数据分布未必吻合 K值只能收敛到局部最优,效果受到初始值影响较大...

  • EM算法在高斯混合模型的应用

    定义 EM算法的一个重要应用是高斯混合模型的参数估计,高斯混合模型的应用广泛,在许多情况下,EM算法是学习高斯混合...

  • EM算法和混合高斯模型(二)

    高斯混合模型 顾名思义,高斯混合模型是指某一群体中含有多个高斯分布,具有如下形式的概率分布模型: 高斯混合模型参数...

  • 2018-11-06

    机器学习: 1、kmeans 2、meanshift 3、最小二乘法 4、逻辑回归、线性回归 5、混合高斯模型 6...

  • 基于高斯分布的Clustering

    独家 | 使用高斯混合模型,让聚类更好更精确(附数据&代码&学习资源) 其它:独家 | 机器学习中的四种分类任务(...

  • 隐马尔可夫模型|机器学习推导系列(十七)

    一、概述 1. 介绍 动态模型可以类比高斯混合模型这种静态模型,高斯混合模型的特点是“混合”,动态模型的特点是在“...

  • [机器学习]GMM混合高斯模型思想

    前言 GMM的全称是Guassian Mixture Model。碰到一个新概念,我们可以从是个角度来理解: 是什...

  • 高斯混合模型

    高斯混合模型(Gaussian Mixture Model)高斯混合模型,通常简称GMM,是一种广泛使用的聚类算法...

  • 高斯混合模型|机器学习推导系列(十三)

    一、概述 以一维数据为例,我们可以看到下图通过将多个单一的高斯模型加权叠加到一起就可以获得一个高斯混合模型,这个混...

  • GATK的VQSR介绍

    高斯混合模型 使用高斯混合模型创建训练集,根据该训练集评估每个变异位点的可信度。每次运行VariantRecali...

网友评论

      本文标题:机器学习day15高斯混合模型

      本文链接:https://www.haomeiwen.com/subject/svfojktx.html