搜索算法工具箱 - DSAH（三）

作者: processor4d | 来源:发表于2022-01-27 22:41 被阅读0次

搜索算法工具箱 - DSAH（三）
搜索算法工具箱 - DSAH（二）
搜索算法工具箱 - DSAH（一）
搜索算法工具箱 - PSSL（三）
搜索算法工具箱 - USER（一）
搜索算法工具箱 - USER（二）
搜索算法工具箱 - PSSL（一）
搜索算法工具箱 - PSSL（二）
算法-二分搜索算法
DFS（深度优先搜索）和BFS(广度优先搜索)

文章名称

【CIKM-2021】【ShenzhenUniversity/Tencent】Deep Self-Adaptive Hashing for Image Retrieval

核心要点

文章旨在解决现有深度无监督散列方法中预先计算的相似度矩阵不可改变，不能在哈希学习过程中进一步探索底层语义，以及容易受到低信息量的成对关系干扰的问题。作者提出了一种深度自适应哈希（DSAH），包括适应邻居发现（AND）和成对信息内容（PIC）两部分。首先，利用AND建立相似度矩阵的临近关系，并随着哈希的学习动态调整。同时，利用PIC计算数据成对关系的权重，从高信息量的成对关系中高效的学习信息。

上一节介绍了AND的两个步骤从初始化和更新，以及如果构造相似度。本节继续介绍IC和学习目标。

方法细节

问题引入

如前所述。作者提出了一种深度自适应哈希（DSAH）模型，DSAH的整体框架如下图所示。该模型包括AND和PIC，2个重要的模块来自适应地捕获语义信息，并且介绍了AND的具体流程。虽然AND提供了一种从相似度矩阵 $W$ 中学习哈希码的方案，它忽略了不同图像对之间的重要性差异。为了解决这个问题，作者提出了PIC，它为每个图像对分配一个自适应权重。如果一个数据对更重要，它将获得更大的权重，并为哈希函数学习做出更多贡献。本节重点介绍这个模块。

DSAH framework

具体做法

Pairwise Information Content

Pairwise Information Content，PIC，的主要目的是区分图像对的重要性，进一步提取语义特征。在计算损失时，PIC为每个图像对分配一个自适应权重，基于该权重得到如下图所示的加权MSE损失函数。

weighted loss

其中， $𝑎_{𝑖𝑗}$ 是数据对 $(𝑖，𝑗)$ 的权重，表示该数据对的重要性。根据信息论[33]，假设一个事件 $Φ$ 发生的概率为 $𝑝(Φ)$ ，其包含的信息量被定义为负对数似然，公式如下图所示。众所周知，概率为1的事件信息量为0，其他就不啰嗦了。

information theory

给定一个数据对 $(𝑖，𝑗)$ ，我们定义事件 $Φ_{𝑖𝑗}$ 表示给定查询图像 $𝑖$ 作为查询目标之后，图像 $𝑗$ 被作为top-1检索结果返回，即是图像 $𝑗$ 是图像 $𝑖$ 检索的最优匹配。其概率记作 $𝑝_{ij}$ 。基于此，作者将图像对的权重 $𝑎_{𝑖𝑗}$ 定义为该事件 $Φ_{𝑖𝑗}$ 发生的信息量，其公式如下图所示，

pairwise weight

如果图像 $𝑗$ 是查询图像 $𝑖$ 的top-1检索结果，那么 $𝑖$ 和 $𝑗$ 应该是最相似的。因此，概率 $𝑝_{ij}$ 可以表示图像 $𝑗$ 和图像 $𝑖$ 之间相似性程度的度量， $𝑝_{ij}$ 的计算公式如下图所示，其中 $𝜏$ 是softmax的温度参数。

probability of pij

不难推断出， $𝑝_{ij}$ 越小，则对应的信息量越大，图像对的权重也越大。符合作者提出的，不相关的图像对，对模型的影响应该越大（包含更多的信息）。

Objective Function

为了保证学习哈希码的质量，作者引入了损失 $L2 = ∥Z − B∥_{2𝐹}$ ，来最小化变量 $Z$ 和二进制码 $B$ 之间的量化误差。模型的总损失函数如下图所示。

Objective Function

Optimization

由于DSAH需要优化两部分的参数，因此作者采用交替优化的方式，直到收敛，

固定相似度矩阵 $W$ ，更新哈希学习网络的参数 $\Theta$ 。
固定哈希学习网络的参数 $\Theta$ ，更新相似度矩阵 $W$ 。

具体算法步骤参见伪代码部分。

代码实现

文章的伪代码如下图所示。

pseudo code

心得体会

信息论

作者巧妙地定义的top-1 rank事件，并利用该时间信息量的大小定义了图像对的权重。同时，该事件的定义符合作者表示的，不相关图像应该具有更大贡献度，更能说明问题的假设。个人觉得，如果是利用information theory的话，也许利用互信息更合理，比如基于MI的对比？不过也许没有这里直接利用相似度 $s$ 计算概率来的直接。

文章引用

[33] Claude E Shannon. 1948. A mathematical theory of communication. The Bell system technical journal 27, 3 (1948), 379–423.

网友评论

搜索算法工具箱

本文标题：搜索算法工具箱 - DSAH（三）

本文链接：https://www.haomeiwen.com/subject/auymhrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

搜索算法工具箱 - DSAH（三）

文章名称

核心要点

方法细节

问题引入

具体做法

Pairwise Information Content

Objective Function

Optimization

代码实现

心得体会

信息论

文章引用

相关文章

搜索算法工具箱 - DSAH（三）

搜索算法工具箱 - DSAH（二）

搜索算法工具箱 - DSAH（一）

搜索算法工具箱 - PSSL（三）

搜索算法工具箱 - USER（一）

搜索算法工具箱 - USER（二）

搜索算法工具箱 - PSSL（一）

搜索算法工具箱 - PSSL（二）

算法-二分搜索算法

DFS（深度优先搜索）和BFS(广度优先搜索)

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

搜索算法工具箱