谱聚类

作者: zelda2333 | 来源:发表于2021-10-25 16:41 被阅读0次

聚类问题可以分为两种思路:

  1. Compactness,这类有 K-means,GMM 等,但是这类算法只能处理凸集,为了处理非凸的样本集,必须引入核技巧。
  2. Connectivity,这类以谱聚类为代表。

如图1所示,上图为Compactness,下图为Connectivity


图1

谱聚类是一种基于带权重无向图的聚类方法。这个图用 G=(V,E) 表示,其中V=\{1,2,\dots,N \}\E= \{\ w_{ij} \},这里w_{ij} 就是边的权重,这里权重取为相似度,W=(w_{ij}) 是相似度矩阵,定义相似度(径向核):

下面定义图的分割,这种分割就相当于聚类的结果。定义w(A,B):

带权重的无向图--谱聚类

假设一共有K个类别,对这个图进行分割:

于是,我们的目标就是 \min \limits_{A_k} CUT(V)

为了平衡每一类内部的权重不同,做归一化的操作,定义每一个集合的度,首先,对单个节点的度定义:

其次,每个集合:

于是:

谱聚类的模型就是:

引入指示向量:

其中,y_{ij}表示第i个样本属于第j个类别,记:Y=(y_1,y_2.\dots,y_N)^T

将N(CUT)写成对角矩阵的形式, 得到:

已知Y,w,求O,P,由于Y^TY=\sum ^N_{i=1} y_iy_i^T,对于y_iy_i^T,只在对角线上的k\tims k处为1,所以:

其中,N_i表示有N_i个样本属于第i类,即N_k=\sum_{k \in A_k}1

引入对角矩阵,根据d_i 的定义

得到

对另一项

另外:

于是这个矩阵的第lm 项可以写为:

这个矩阵的对角线上的项和 w(A_i,A_i) 相同,所以取迹后的取值不会变化。

所以:

其中, L=D-w 叫做拉普拉斯矩阵。

相关文章

  • 谱聚类算法总结

    聚类三种方法:k-means聚类、密度聚类、层次聚类和谱聚类Spectrum Clustering 简述 谱聚类是...

  • 待完成:scikit 聚类方法 可用源代码

    kmeans聚类 spec 谱聚类

  • 14 聚类算法 - 代码案例六- 谱聚类(SC)算法案例

    13 聚类算法 - 谱聚类 需求 使用scikit的相关API创建模拟数据,然后使用谱聚类算法进行数据聚类操作,并...

  • Clustering

    本文结构安排 经典聚类算法:线性聚类 Kmeans 经典聚类算法:非线性聚类 DBSCAN、谱聚类 新兴聚类算法:...

  • Day 684:机器学习笔记(13)

    谱聚类 KMeans需要事先确定有多少簇,谱聚类可以不需要事先指定。 基于图切割的谱聚类算法分两个主要步骤:图切割...

  • 谱聚类

    Spectral Clustering 和传统的聚类方法(例如 K-means)比起来有不少优点: 和K-medo...

  • 谱聚类

    原理:谱聚类(Spectral Clustering, SC)是一种基于图论的聚类方法——将带权无向图划分为两个或...

  • 谱聚类

    谱聚类原理介绍: https://www.cnblogs.com/pinard/p/6221564.html 谱聚...

  • 谱聚类

    先收藏下,数学不好的我,还要再看看 谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统...

  • 谱聚类

    背景:谱聚类(Spectral Clustering)于 2006 年由 Ulrike von Luxburg 公...

网友评论

      本文标题:谱聚类

      本文链接:https://www.haomeiwen.com/subject/bxyhaltx.html