美文网首页
聚类算法-kmeans

聚类算法-kmeans

作者: 八刀一闪 | 来源:发表于2016-09-21 22:37 被阅读56次

简介

k-means应该是最简单的一个聚类算法了,它的优化目标是使所有数据点到它们各自的最近类别中心的距离总和最小。其实k-means是基于质心的聚类,它假设类别的形状是球形的,并通过EM的方法进行求解。它的缺点是对噪声敏感,无法发现任意形状的类别,不稳定。

优化目标:


算法过程

  1. 首先随机选出k个数据作为类别中心
  2. 然后将其他数据分配到距离他们最近的类别中
  3. 将类别中心更新为所有这个类别中的数据的均值
  4. 迭代2和3,直至算法稳定

k-means++

由于k-means受初始中心的影响严重,而随机选择很可能使得中心分布不均匀。k-means++的想法就是通过控制生成初始中心的过程来使得中心分布均匀,具体为顺序选择初始中心,使得新选择的中心距离已有的中心尽可能地远。初始中心的过程如下:
  1. 首先随机选择一个中心
  2. 然后计算其他数据点到已有中心的最近距离记为D(x)
  3. 按照按照概率从数据点中选取下一个中心,每个数据点被选取的概率=


  4. 迭代2和3直至选出k个中心

参考文献

  1. k-means++: The Advantages of Careful Seeding

相关文章

  • kmeans算法

    kmeans算法 简介kmeans算法 kmeans算法又称k平均或k均值算法,一种已知聚类类别数的聚类算法。 它...

  • Spark实现 -- Kmeans聚类算法

    Spark实现 -- Kmeans聚类算法 Kmeans简介 Kmeans是最常用的聚类算法,也是十大经典的数据挖...

  • Clustering

    本文结构安排 经典聚类算法:线性聚类 Kmeans 经典聚类算法:非线性聚类 DBSCAN、谱聚类 新兴聚类算法:...

  • Kmeans聚类算法简介(有点枯燥)

    1. Kmeans聚类算法简介 由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。...

  • Kmeans聚类算法简介

    1. Kmeans聚类算法简介 由于具有出色的速度和良好的可扩展性,Kmeans聚类算法算得上是最著名的聚类方法。...

  • 简单聚类算法

    一些聚类算法 Birch层次聚类 ,KMeans原形算法 ,AGNES层次算法, DBSCAN密度算法, LVQ原...

  • K均值聚类及代码实现

    KMeans聚类 在聚类算法中,最出名的应该就是k均值聚类(KMeans)了,几乎所有的数据挖掘/机器学习书籍都会...

  • KNN与K-Means算法的区别

    内容参考:Kmeans算法与KNN算法的区别kNN与kMeans聚类算法的区别 KNN-近邻算法-分类算法 思想:...

  • 如何确定kmeans算法的k值

    问题的提出: Kmeans算法中,K值所决定的是在该聚类算法中,所要分配聚类的簇的多少。Kmeans算法对初始值是...

  • 二分 KMeans,Bisecting KMeans 代码实现

    算法原理:由于传统KMeans算法的聚类结果易受初始聚类中心点选择的影响,因此在传统的KMeans算法的基础上进行...

网友评论

      本文标题:聚类算法-kmeans

      本文链接:https://www.haomeiwen.com/subject/duaaettx.html