聚类算法-kmeans

聚类算法-kmeans

作者: 八刀一闪 | 来源:发表于2016-09-21 22:37 被阅读56次

kmeans算法
Spark实现 -- Kmeans聚类算法
Clustering
Kmeans聚类算法简介（有点枯燥）
Kmeans聚类算法简介
简单聚类算法
K均值聚类及代码实现
KNN与K-Means算法的区别
如何确定kmeans算法的k值
二分 KMeans，Bisecting KMeans 代码实现

简介

k-means应该是最简单的一个聚类算法了，它的优化目标是使所有数据点到它们各自的最近类别中心的距离总和最小。其实k-means是基于质心的聚类，它假设类别的形状是球形的，并通过EM的方法进行求解。它的缺点是对噪声敏感，无法发现任意形状的类别，不稳定。

优化目标：

算法过程

首先随机选出k个数据作为类别中心
然后将其他数据分配到距离他们最近的类别中
将类别中心更新为所有这个类别中的数据的均值
迭代2和3，直至算法稳定

k-means++

由于k-means受初始中心的影响严重，而随机选择很可能使得中心分布不均匀。k-means++的想法就是通过控制生成初始中心的过程来使得中心分布均匀，具体为顺序选择初始中心，使得新选择的中心距离已有的中心尽可能地远。初始中心的过程如下：

首先随机选择一个中心
然后计算其他数据点到已有中心的最近距离记为D(x)
按照按照概率从数据点中选取下一个中心，每个数据点被选取的概率＝
迭代2和3直至选出k个中心

参考文献

k-means++: The Advantages of Careful Seeding

相关文章

kmeans算法
kmeans算法简介kmeans算法 kmeans算法又称k平均或k均值算法，一种已知聚类类别数的聚类算法。它...
Spark实现 -- Kmeans聚类算法
Spark实现 -- Kmeans聚类算法 Kmeans简介 Kmeans是最常用的聚类算法，也是十大经典的数据挖...
Clustering
本文结构安排经典聚类算法：线性聚类 Kmeans 经典聚类算法：非线性聚类 DBSCAN、谱聚类新兴聚类算法：...
Kmeans聚类算法简介（有点枯燥）
1. Kmeans聚类算法简介由于具有出色的速度和良好的可扩展性，Kmeans聚类算法算得上是最著名的聚类方法。...
Kmeans聚类算法简介
1. Kmeans聚类算法简介由于具有出色的速度和良好的可扩展性，Kmeans聚类算法算得上是最著名的聚类方法。...
简单聚类算法
一些聚类算法 Birch层次聚类，KMeans原形算法，AGNES层次算法， DBSCAN密度算法， LVQ原...
K均值聚类及代码实现
KMeans聚类在聚类算法中，最出名的应该就是k均值聚类(KMeans)了，几乎所有的数据挖掘/机器学习书籍都会...
KNN与K-Means算法的区别
内容参考：Kmeans算法与KNN算法的区别kNN与kMeans聚类算法的区别 KNN-近邻算法-分类算法思想：...
如何确定kmeans算法的k值
问题的提出： Kmeans算法中，K值所决定的是在该聚类算法中，所要分配聚类的簇的多少。Kmeans算法对初始值是...
二分 KMeans，Bisecting KMeans 代码实现
算法原理：由于传统KMeans算法的聚类结果易受初始聚类中心点选择的影响，因此在传统的KMeans算法的基础上进行...

网友评论

本文标题：聚类算法-kmeans

本文链接：https://www.haomeiwen.com/subject/duaaettx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|聚类算法-kmeans|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！