论文阅读“Deep Multiple Auto‑Encoder‑

论文阅读“Deep Multiple Auto‑Encoder‑

作者: 掉了西红柿皮_Kee | 来源:发表于2023-05-30 21:41 被阅读0次

论文阅读“Deep multi-kernel auto-enco
AE for time series
论文阅读“Adaptive Graph Auto-Encoder
论文笔记：Clustering and Unsupervised
DEEP GRAPH INFOMAX 阅读笔记
基于深度卷积神经网络和跳跃连接的图像去噪和超分辨
Auto-Encoder
25组-Deep Residual Learning for I
腾讯 “绝悟”论文披露技术细节。
Semi-supervised Text Classificat

Du G, Zhou L, Yang Y, et al. Deep multiple auto-encoder-based multi-view clustering[J]. Data Science and Engineering, 2021, 6(3): 323-338.

摘要导读

本文作者基于多个自编码器提出了深度多视图聚类算法MVC-MAE。MVC-MAE采用自动编码器，以分层的方式捕获每个视图的非线性结构信息，并同时结合了每个视图内部的局部不变性以及任意两个视图之间的一致性和互补信息。除此之外，还将表示学习和聚类整合到一个统一的框架中，并进行联合优化。

模型浅析

数据定义
给定数据集 $X=\{X^{(s)} \in \mathbb{R}^{m \times n^s}\}_{s=1}^S$ ， $S$ 是视图的数量， $n^s$ 是第 $s$ 个视图的特征维度， $m$ 表示样本的数量， $X^{(s)}$ 代表第 $s$ 个视图的数据， $X_i^{(s)}$ 表示第 $s$ 个视图的第 $i$ 个样本， $X_{i, j}^{(s)}$ 代表 $s$ 视图的第 $(i,j)$ 个元素。整个多视图任务的目标在于将样本分配到 $C_{cluster}$ 个类簇中。两个样本之间的相似度表示为 $sim(X_i^{(s)},X_j^{(s)})$ ，一般使用欧式距离或者皮尔逊相关系数等函数来计算。
网络结构
多视图聚类的核心在于有效的融合视图内和视图间信息以获取到高质量的聚类结果。基于多个自编码器的网路结构在于捕获四种类型的信息，如：层次化的非线性结构信息，局部几何信息，一致性和互补性以及聚类结构信息。
1 层次化的非线性结构信息。这里采用的是多个深度自编码器。模型的结构就是多个深度自编码器，每个视图都对应一个自编码器模型。总体的损失函数可以表示为：其中 $\odot$ 表示对位相乘， $B^{(s)}=\{B_i^{(s)}\}_{i=1}^m$ 表示 $s$ 视图对应的权重，用于为非零元素和零元素赋予不同的惩罚权重。使用这样的损失可以减轻由数据稀疏所带来的不稳定性。 $B^{(s)}$ 中的每个元素定义为如下的形式：其中 $\beta >0$ 。在这种定义之下，不仅可以平滑数据流型，还能保留样本之间的相似性。
2 局部几何信息。局部几何信息由原始输入生成的亲和图 $\{W^{(s)}\}_{s=1}^S$ 来捕获。这里使用的是基于欧式距离的k-NN算法来构建对应于每个视图的亲和图。具体的生成算法如下所示：其中， $N_k({X_i^{(s)}})$ 是样本 $X_i^{(s)}$ 对应的k个近邻， $j_k$ 表示样本 $X_i^{(s)}$ 的第 $k$ 个近邻。
设 $P_{i,j}^{(s)}=P_{i,j}^{(s,s)}$ 为样本 $X_i^{(s)}$ 和 $X_j^{(s)}$ 在 $s$ 视图的联合概率，定义为如下形式：因此，每个视图的局部集合信息可以表示为最大化如下的似然估计：通过转化，可以等同于最小化如下的负对数似然：
3 一致性和互补性信息。一致性和互补性信息的利用使用的是二分类的思想，使用 $C_{i,j}^{(s1,s2)}$ 来表示是否来自两个视图的表示 $H_i^{(s_1)}$ 和 $H_j^{(s_2)}$ 是否描述同一个样本。如果来自同一个样本，则 $C_{i,j}^{(s1,s2)}=1$ ，否则 $C_{i,j}^{(s1,s2)}=0$ 。换句话说，如果 $i=j$ 则 $C_{i,j}^{(s1,s2)}=1$ ，否则 $C_{i,j}^{(s1,s2)}=0$ 。基于这个定义，可以为多视图聚类定义一种新的交叉熵损失：该损失意在将来自同一样本不同视图的描述之间的差异性降到最低。
其中， $P_{i,j}^{(s_1,s_2)}$ 是联合概率：此外，作者还考虑到一种情况：虽然两个视图表示不是来自同一个样本，即 $i \neq j$ ；但是根据局部几何信息， $H_i^{(s_1)}$ 和 $H_j^{(s_2)}$ 应该相似，那么这两个样本表示也不应该被推远。因此， $L_{2CC}^{(s_1, s_2)}$ 可以放松到：即推远的样本仅仅是哪些满足 $W_{i,j}=0$ 的样本对。
当视图的数量大于2时，最终的损失函数写成如下的形式：
4 聚类结构信息。这里主要还是对学到的低维表示 $H^{(s)}$ 进行了拼接得到 $Z$ ，然后用于后续的融合聚类。聚类层还是沿用了DEC的聚类思想，利用 $Z$ 构造了聚类损失 $\mathcal{L}_{CLU}$ ，同时实现聚类分配和表示学习的优化。
总体损失及总体算法

算法伪代码：（13）（14）（15）（16）

突然想到，在构造适用于多视图聚类的二分类的时候，正负样本的不平衡问题是否会对最终的结构有影响 ==

相关文章

论文阅读“Deep multi-kernel auto-enco
Lu H, Liu S, Wei H, et al. Deep multi-kernel auto-encoder...
AE for time series
Auto encoder for time series Auto encoder for time series...
论文阅读“Adaptive Graph Auto-Encoder
Li X, Zhang H, Zhang R. Adaptive Graph Auto-Encoder for G...
论文笔记：Clustering and Unsupervised
论文思想：在Auto-Encoder的训练中，加入一个L2 normalization constraint，利...
DEEP GRAPH INFOMAX 阅读笔记
DGI: Deep Graph Infomax 阅读笔记论文来源：2019 ICLR 论文链接：Deep Gra...
基于深度卷积神经网络和跳跃连接的图像去噪和超分辨
Image Restoration Using Very Deep Convolutional Encoder-D...
Auto-Encoder
25组-Deep Residual Learning for I
“Deep Residual Learning for Image Recognition” 阅读笔记论文作者：...
腾讯 “绝悟”论文披露技术细节。
【论文阅读】Mastering Complex Control in MOBA Games with Deep R...
Semi-supervised Text Classificat
Paper Paper1 : Semi-supervised Auto-encoder for Sentiment...

网友评论

本文标题：论文阅读“Deep Multiple Auto‑Encoder‑

本文链接：https://www.haomeiwen.com/subject/wmjeedtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|论文阅读“Deep Multiple Auto‑Encoder‑|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！