- 论文阅读“Deep Incomplete Multi-view
- 论文阅读“Deep Incomplete Multi-View
- 论文阅读“Incomplete multi-view clust
- [PED05]Incomplete Multi-view Clu
- 论文阅读“Deep Adversarial Multi-view
- DeepMVS: Learning Multi-view Ste
- 论文阅读“DIMC-net: Deep Incomplete M
- 论文阅读“Deep Embedded Multi-view Cl
- 论文阅读“Deep Multi-view Sparse Subs
- 论文阅读“Robust deep multi-view subs
S. Wei, J. Wang, G. Yu, C. Domeniconi and X. Zhang, "Deep Incomplete Multi-view Multiple Clusterings," 2020 IEEE International Conference on Data Mining (ICDM), 2020, pp. 651-660, doi: 10.1109/ICDM50108.2020.00074.
摘要导读
多视图聚类旨在利用来自多个异构视图的信息来促进聚类。以往的大多数工作只基于预定义的聚类标准寻找一个最优聚类,但设计这样一个能够捕获用户需要的标准是困难的。由于多视图数据的多样性,我们可以探索有意义的alternative聚类。此外,不完全多视图数据问题在现实世界中是普遍存在的,但尚未对多重聚类进行研究。为了解决这些问题,本文引入了一个深度不完全多视图多聚类(DiMVMC)框架,该框架通过优化多组解码器深度网络,实现了同时对数据视图和多个共享表示的学习。此外,它最小化了一个冗余项,以同时控制这些表示之间和不同网络参数之间的多样性。然后,从每个共享表示中生成一个独立的聚类。在基准数据集上的实验证实,DiMVMC在生成具有高多样性和高质量的多个聚类方面优于最先进的对比方法。
- 现有的多视图聚类算法关注于多视图数据的多样性,但是聚焦于只产生一个单一的聚类结果。但是多视图中涉及到的多样性完全可以支持产生多个有意义的聚类结果。
例如,一堆具有异质视角的面部图像可以从身份、性别和情感的角度单独分组。
所有这些分组都是不同的,但都很有意义。
- 除了关注聚类的质量,multiple clusterings还追求聚类结果的多样性。因此,越来越多人关注到多视图多聚类(MVMC)任务。一般来说,这类方法利用自表示对多视图数据的个体信息和共享信息进行挖掘,然后对个体特征和共性特征的组合进行分解,以得到多个聚类结果。但这类方法并没有考虑多视图数据缺失的情况。
在本文中综合考虑上述问题,提出了一个深度不完整多视图多聚类框架(deep incomplete multi-view multiple clusterings framework ,DiMVMC)。
模型浅析

在给定共享多视图表示
A. 产生多表示子空间
假设一个包含个视图的多视图数据集共有
个样本。
表示第
个视图的第
个样本的特征向量,
是特征的维度。缺失指示矩阵
:

在本文中,以一种灵活的方式将具有任意视图缺失模式的样本投影到共享的子空间中,其中子空间包括可观测视图的信息。在这种情况下,每个视图都可以通过获得的共享表示来进行重建:

根据多视图的多样性,多视图数据一般具有不同的分布,多个不同的子空间及聚类结果是共存的。为获取多个(


在不丧失一般性的情况下,假设数据是独立且同分布的,可以推导出对数似然函数如下:


与传统基于自动编码器的方案不同,DiMVMC跳过了编码器网络,并以共享子空间表示
B. 减少子空间之间的冗余性
对于多个聚类,除了不同聚类的质量外,聚类之间的多样性也很重要。多样性通常是通过最小化这些子空间之间的冗余来近似获得的。
在本模型中,作者采用的是HSIC来度量希尔伯特子空间和
的交叉协方差算子来估计两个子空间的依赖性。形式化为如下:


C. 统一模型
通过对前两个优化目标的整合,DiMVMC的损失函数综合为如下:


在子空间聚类中,期望子空间学出的表示是稀疏并且可以捕获类簇语义信息。这里可以选择在深度模型中添加dropout层。为了直观地实现,可以在上述损失函数中添加了一个稀疏诱导的正则化,并定义了一个 Sparse DiMVMC:

使用多个Decoder来构造个共享子空间,类似于多头注意力机制对不同语义空间的学习。另外关于Multiple Clustering评价指标也很有趣,值得探究。
网友评论