Kmeans如何确定聚类个数K

Kmeans如何确定聚类个数K

作者: 0过把火0 | 来源:发表于2018-10-12 14:42 被阅读15次

Kmeans如何确定聚类个数K
kmeans算法
基于K-Means算法的离群点检测（MATLAB代码实现）
scikit_learn学习笔记四——无监督学习之聚类与降维
KNN与K-Means对比
K均值聚类及代码实现
关于聚类类别数k的选择
用肘方法确定 kmeans 聚类中簇的最佳数量
100天搞定机器学习|day43 几张GIF理解K-均值聚类原理
如何确定kmeans算法的k值

序

在面试过程中经常问到K值如何确定，很多人说需要尝试，的确没错，但是更多地需要讲出来对每次尝试的结果是如何进行评价的。

肘部法则

实际上，一开始是很难确定聚类数的，下图的两种聚类数似乎都是可行的：

但是，也存在一种称之为肘部法则（Elbow Method）的方法来选定适当的K值：

上图曲线类似于人的手肘，“肘关节”部分对应的 K 值就是最恰当的 K 值，但是并不是所有代价函数曲线都存在明显的“肘关节”，例如下面的曲线：

一般来说，K-Means 得到的聚类结果是服务于我们的后续目的（如通过聚类进行市场分析），所以不能脱离实际而单纯以数学方法来选择 K 值。在下面这个例子中，假定我们的衣服想要是分为 S,M,L 三个尺码，就设定 K=3 ，如果我们想要 XS、S、M、L、XL 5 个衣服的尺码，就设定 K=5 ：

轮廓系数

轮廓系数：
是评判聚类好坏的标准，结合类内聚合度以及类间分离度两种指标来计算得到。
计算方法：
a. 计算样本 i 到同簇内其他样本的平均距离 $a_i$ ，该值越小，说明样本 i 越应该被聚类到该簇中，可以将 $a_i$ 称作样本的簇内不相似度。
b. 簇 C 中所有样本的 $a_i$ 均值被称作是簇C的簇不相似度。
计算样本 i 到其他簇 $C_j$ 中所有样本的平均距离 $b_{ij}$ 称作是样本 i 与簇 $C_j$ 的不相似度。定义样本 i 的簇间不相似度为： $b_i$ = min(bi1, bi2…bik)
c. $b_i$ 越大说明样本 i 越不属于其他簇。
根据样本 i 的簇内不相似度 $a_i$ 和簇间不相似度 $b_i$ ，定义样本 i 的轮廓系数：
判断方法
□ s_i 越接近1，则说明样本 i 聚类合理。
□ s_i 越接近-1，说明样本 i 更适合聚到其他类
□ s_i越接近0，则说明样本 i 在两个簇的边界上
```
 ○ 根据轮廓系数选取k
```

我们可以在固定的k值上多次执行，求取轮廓系数的均值，再依据上述判断准则选出合理的k值。

转载注明：https://www.jianshu.com/p/f2b3a66188f1

相关文章

Kmeans如何确定聚类个数K
序在面试过程中经常问到K值如何确定，很多人说需要尝试，的确没错，但是更多地需要讲出来对每次尝试的结果是如何进行评...
kmeans算法
kmeans算法简介kmeans算法 kmeans算法又称k平均或k均值算法，一种已知聚类类别数的聚类算法。它...
基于K-Means算法的离群点检测（MATLAB代码实现）
一、数据二、代码实现采用K-Means聚类算法，设定聚类个数K为3，最大迭代次数为500次，距离函数取欧式距离...
scikit_learn学习笔记四——无监督学习之聚类与降维
无监督学习发现数据本身的分布特点数据聚类K-means 预先设定聚类个数，再不断更新聚类中心，多轮迭代后，使得...
KNN与K-Means对比
Kmeans算法的缺陷聚类中心的个数K 需要事先给定，但在实际中这个 K 值的选定是非常难以估计的，很多时候，事...
K均值聚类及代码实现
KMeans聚类在聚类算法中，最出名的应该就是k均值聚类(KMeans)了，几乎所有的数据挖掘/机器学习书籍都会...
关于聚类类别数k的选择
如何确定聚类的类别个数由适当的阈值确定根据数据点的散布图直观地确定类的个数手肘法，利用核心指标SSE（sum...
用肘方法确定 kmeans 聚类中簇的最佳数量
用肘方法确定 kmeans 聚类中簇的最佳数量 - 赏尔 - 博客园 KMeans 聚类中的超参数是 K，需要我们...
100天搞定机器学习|day43 几张GIF理解K-均值聚类原理
前文推荐如何正确使用「K均值聚类」？ KMeans算法是典型的基于距离的聚类算法，采用距离作为相似性的评价指标，...
如何确定kmeans算法的k值
问题的提出： Kmeans算法中，K值所决定的是在该聚类算法中，所要分配聚类的簇的多少。Kmeans算法对初始值是...

网友评论

秋招-算法

本文标题：Kmeans如何确定聚类个数K

本文链接：https://www.haomeiwen.com/subject/khcgaftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

秋招-算法

关于我们|服务条款|联系我们|Kmeans如何确定聚类个数K|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！