聚类算法的评估

作者: dreampai | 来源:发表于2019-03-28 13:54 被阅读0次

聚类评估的任务是估计在数据集上进行聚类的可行性,以及聚类方法产生结果的质量。这一过程又分为三个子任务:

1、估计聚类趋势

检测数据分布中是否存在非随机的簇结构。

  • 观察法:可以观察聚类误差是否随聚类类别数量的增加而单调变化,如果数据是基本随机的,即不存在非随机簇的结构,那么聚类误差随聚类类别数量增加而变化的幅度应该较不显著,并且找不到一个合适的 K 对应数据的真实簇数。
  • 霍普金斯统计量:判断数据在空间上的随机性。如果样本接近随机分布,即 H 的值接近于 0.5,如果聚类趋势明显,则随机生成的样本点距离应该远大于实际样本点的距离,H 值接近于 1.

2、判定数据簇数

  • 手肘法
  • Gap Statistic 方法

3、测定聚类质量

  • 轮廓系数
  • 均方根标准偏差
  • R 方:用来衡量聚类的差异度,RS 代表了聚类之后的结果与聚类之前相比,对应的平方误差与指标改进幅度。
  • 改进的 HubertT统计:通过数据对的不一致性来评估聚类的差异。当值越大说明聚类的结果与样本的原始距离越吻合,聚类质量越高。

相关文章

  • 聚类算法总结

    1、K 均值聚类 2、凝聚聚类 3、DBSCAN 算法 4、聚类算法的评估

  • 08 聚类算法 - 聚类算法的衡量指标

    07 聚类算法 - 代码案例三 - K-Means算法和Mini Batch K-Means算法效果评估 四、聚类...

  • 聚类算法的评估

    聚类评估的任务是估计在数据集上进行聚类的可行性,以及聚类方法产生结果的质量。这一过程又分为三个子任务: 1、估计聚...

  • 聚类算法的评估

    1、用真实值评估聚类 调整兰德系数 (Adjusted Rand index) 2、在没有真实值的情况下评估聚类 ...

  • 聚类分析

    1,聚类方法: Python 主要聚类分析方法: 2,聚类分析算法评估 ☉ Purity评估方法 ☉ RI评价法 ...

  • 聚类算法模型评估

    ● 混淆矩阵● 均一性● 完整性● V-measure● 调整兰德系数(ARI)● 调整互信息(AMI)● 轮廓系...

  • 机器学习day18聚类算法评价

    聚类算法评估 假设没有外部标签数据,我们怎么评价不同聚类算法的优劣? 非监督学习往往没有标注数据,这是模型,算法的...

  • Clustering

    本文结构安排 经典聚类算法:线性聚类 Kmeans 经典聚类算法:非线性聚类 DBSCAN、谱聚类 新兴聚类算法:...

  • 11 聚类算法 - 密度聚类 - DBSCAN、MDCA

    09 聚类算法 - 层次聚类10 聚类算法 - 代码案例四 - 层次聚类(BIRCH)算法参数比较 七、密度聚类概...

  • 07 聚类算法 - 代码案例三 - K-Means算法和Mini

    03 聚类算法 - K-means聚类04 聚类算法 - 代码案例一 - K-means聚类05 聚类算法 - 二...

网友评论

    本文标题:聚类算法的评估

    本文链接:https://www.haomeiwen.com/subject/jrvfbqtx.html