论文粗读“HCSC: Hierarchical Contrast

作者: 掉了西红柿皮_Kee | 来源:发表于2022-05-11 15:58 被阅读0次

论文粗读“HCSC: Hierarchical Contrast
MoCo：无监督视觉表示学习的动量对比
HGAT：假新闻检测的分层图注意力网络
直方图均衡&对比度保持
TensorFlow实现(十一)Attention机制
推荐系统遇上深度学习(八十四)-[阿里]抽取用户多维度兴趣的DH
2019-06-20
论文阅读 Object Proposal by Multi-Br
下一个购物篮推荐中的层次表达模型
论文阅读“SimCTC: A Simple Contrast L

Guo Y, Xu M, Li J, et al. HCSC: Hierarchical Contrastive Selective Coding[J]. arXiv preprint arXiv:2202.00455, 2022.

emmm...摆烂阅读

动机分析

图片数据中通常包含多种语义层级，如对于狗这个类别中，又可以根据细粒度的特征进行子类别的划分。由此，本文使用树形的层级原型来刻画包含在其中的层级语义结构，如下所示：

对于得到的树形结构而言，每一层则可以代表不同的层级语义空间。本文后续的工作，是利用这种层级语义信息对对比学习过程中负例的选择进行优化，从而得到更具有辨别性的特征表示。

问题形式化

目标：为给定的无标签数据 $X=\{x_1, x_2, \cdots, x_N\}$ 学习一个低维的特征向量表示 $Z \in \mathbb{R}^{N \times \delta}$ 。
除了数据表示外，还需要维持一个层级原型的表示集合 $C=\{\{c_i^l\}_{i=1}^{M_l}\}_{l=1}^L$ 。这个看似符号很多的集合，就是本文的关键。首先， $L$ 代表需要捕获的层级信息对应的层数，例如，上图中是一个包含三层的树形结构，即 $L=3$ ；其次， $M_l$ 则代表中第 $l$ 层中包含的类簇的数量，例如上图中，画出的第一层包含3个类别，即 $M_1=3$ 。为了保证后续运算的便捷性，作者这里约束 $c_i^l \in C$ 都是 $\delta$ -dim向量。通过层级的k-means算法，可以得到多层级的语义结构表示。具体算法如下：