美文网首页
K-Means(二)初始质心的选择

K-Means(二)初始质心的选择

作者: shijiatongxue | 来源:发表于2018-10-11 21:29 被阅读0次

回顾:

通过第一讲,我们已经知道了关于最优k值的选择,可以用SSE(组内差)和轮廓系数。

K值的选择

        1.先验知识

        2.SSE

        3.轮廓系数


现在介绍一下初始质心的选择:

        1.随机选择

        选择初始质心,我们可以用最基本的随机方法,但是这种方法会导致一个局部最优解问题。即,将一个比较大的簇分裂,同时将两个较小的簇进行合并。

        由于K-Means算法具有不稳定性,初始质心选择不同,结果也不同。所以解决局部最优的方法,其一可以多次运行算法,选择具有最小SSE值的那组作为最终解。这种方法通过多次运行,通过尝试,来解决随机选择初始质心问题。

        不过可以通过以下其他方法来寻找比较好的初始质心。

        2.层次聚类

        通过层次聚类,划分k个层次,计算出每个簇对应的质心作为K-Means算法的初始质心。这种方法可以很好地解决初始质心指派不合理的问题。但是也有局限性。

        3.K-Means++

        K-Means++算法是基本算法的改进版,其区别就在于初始质心的选择。

        该算法第一个质心是随机选择的,接下来的质心基于样本点与最近质心的距离,距离越大越可能被选为下一个质心,直到选择完k个质心。

        该方法有效地解决了关于初始质心的选取问题,目前已经成为了一种硬聚类算法的标准。但是该方法无法解决离群点问题。

        4.基于最近邻密度

        该方法通过检测样本点的样本密度和与之前质心的分散度来决定下一个质心。

相关文章

  • K-Means(二)初始质心的选择

    回顾: 通过第一讲,我们已经知道了关于最优k值的选择,可以用SSE(组内差)和轮廓系数。 K值的选择 1....

  • 机器学习--K-means算法原理

    一. 概念K-means:事先确定常数K,常数K意味着最终的聚类类别数,首先随机选定初始点为质心,并通过计算每一个...

  • 第四章 无监督学习:聚类

    动机 聚类的目标是将数据集分组。质心、层级聚类、识别噪声、距离限制 K-means 1.算法2.如何选择K值选择对...

  • 随记1:2

    K-Means 1.随机选取k个质心点 2.计算各个点到质心的距离 3.将点的类划分为离他最近的质心,形成K个cl...

  • 机器学习笔记5-k-means和k-medoids

    简单对比一下这两者的区别。两者的主要区别主要在质心的选择中,k-means是样本点均值,k-medoids则是从样...

  • K-Means(一)K值的选择

    算法1.1 基本K均值算法 1:选择K个点作为初始质心 2:repeat 3: 将每一个点指派到最近...

  • 2019-04-28

    K-means聚类算法 K-means短板 K值敏感 初始值敏感 离群点敏感

  • Kmeans如何初始化聚类中心

    确定初始化质心的方法 通常情况下,我们会在m个样本中选择K个(K

  • 聚类算法(二)——K-means聚类

    简介 k-means算法是1967年由MacQueen首次提出的一种经典算法,它是一种基于质心的划分方法,这种方法...

  • K-means《机器学习实战》基础整理

    主要内容 一般K-means: 簇数k是用户给定的,每个簇通过其质心(centroid),即簇中所有点的中心来描述...

网友评论

      本文标题:K-Means(二)初始质心的选择

      本文链接:https://www.haomeiwen.com/subject/axeiaftx.html