美文网首页
聚类评估:轮廓系数(Silhouette Coefficient

聚类评估:轮廓系数(Silhouette Coefficient

作者: UlissesJr | 来源:发表于2018-09-20 19:55 被阅读240次
  • 计算样本i到同簇其他样本的平均距离ai,ai越小,说明样本i越应该被聚类到该簇。将ai 成为样本i的簇内不相似度。

  • 计算样本i到其他某簇Cj的所有样本的平均距离bij,称为样本i与簇cj的不相似度。定义为样本i的簇间不相似度:bi=min{bi1,bi2,......bik}

  • si接近1,则说明样本i聚类合理。

  • si接近-1,则说明样本i更应该分类到另外的簇。

  • 若si近似为0,则说明样本i在两个簇的边界上。

下面我用K-Means 和 DBSCAN 分别进行了聚类,并且用轮廓评估做了计算

部分代码如下:

相关文章

网友评论

      本文标题:聚类评估:轮廓系数(Silhouette Coefficient

      本文链接:https://www.haomeiwen.com/subject/mlmnnftx.html