Cross-modal Hallucination for Fe

作者: hzb_ml | 来源:发表于2019-01-11 11:58 被阅读4次

Cross-modal Hallucination for Fe
NeurIPS 2021：Learning with Noisy
Villanelle 2: Awakening
cross-modal similarity hashing
codis 小结（配置）
词为我用 - barefaced
Untitled
Apache Doris——安装部署之扩容缩容
li fe
chi fe

Cross-modal Hallucination for Few-shot Fine-grained Recognition

最先进的深度学习算法需要大量的数据用于模型训练，缺乏会导致性能恶化，尤其是在不同类别之间具有细粒度的边界的时候。

Introduction

方法背后的直觉是生成额外训练的样本，这些样本适用于文本描述，有助于在低数据场景中学习分类模型。

贡献有：

根据细粒度视觉识别任务提出多模态Few-shot学习的基准，该任务在训练阶段是多模态的，测试时是单模态的(图像)。
开发了类别判断的文本条件生成对抗网络(tcGAN)，通过在细粒度文本描述的条件下隐藏额外的图像来促进Few-shot学习。

idea

从数据集中学习分类器，每个类别的几个样本通过以文本描述为条件的幻觉数据进行扩展。

Multimodal Few-shot Learning Benchmark

目标是建立多模态Few-shot细粒度识别的基准模仿实践中出现的情况。受Low-shot Visual Recognitionby Shrinking and Hallucinating Features. 启发，提出Few-shot学习基准并将其扩展为使用多模态训练数据。建立由多个阶段组成的Few-shot学习框架。第一阶段在大型训练集上进行学习得到一些有意义的表示，下一阶段在少量样本上进行微调。

Method

[图片上传失败...(image-6401df-1547150302469)]

总体框架分为两个阶段，

表示学习，训练text-conditional GAN给定文本描述生成hallucinate图像。
微调阶段，通过样本选择策略从生成的图像中选择最具有辨别力的部分。

Discriminative Text-Conditional GAN

遵循元学习框架，在 $\mathcal { C } _{ \text { base } }$ (非小样本基础类数据)上大量数据中学习生成模型。然后在 $\mathcal{C}_{novel}$ (新的细粒度类)上学习与之相关的分类器。构造一个text-conditional GAN用于学习从文本到图像的映射。这样生成器G被训练，从而生成不能被判别器判断出真假的图像。

tcGAN的目标函数：

$\begin{aligned} \mathcal { L } _ { t c G A N } ( G , D ) = \mathbb { E } _ { I , T } & [ \log D ( I , T ) ] \\ & + \mathbb { E } _ { I , z } [ \log D ( I , G ( T , z ) ) ] \end{aligned}$

其中的 $z$ 是随机噪声向量， $T$ 和 $I$ 是观察文本和图像的embeddings。

单独优化 $\mathcal { L } _ { t c G A N }$ 缺少类间的区分度，向 $\mathcal { L } _ { t c G A N }$ 中增加一个class-discriminative项 $\mathcal { L } _ { \text { class } }$ ，被定义为：

$\mathcal { L } _ { \text {class} } ( D ) = \mathbb { E } [ P ( C = c | I ) ]$

$c$ 是类标签。另外，令：

$\mathcal { L } _ { c l a s s } ( D ) = \mathcal { L } _ { c l a s s } ( G )$

引出两个损失项：

$\mathcal { L } ( D ) = \mathcal { L } _ { t c G A N } ( G , D ) + \mathcal { L } _ { \text {class} } ( D )$

$\mathcal { L } ( G ) = \mathcal { L } _ { t c G A N } ( G ) - \mathcal { L } _ { c l a s s } ( G )$

通过优化得到 $D^*$ 和 $G^*$ 。

Self-paced Sample Selection

通过训练 $G*$ 能够生成足够多的样本，我们需要从生成的样本库中挑选足够的样本，以便于细粒度Few-shot能够构建更好的分类器。选择生成器和鉴别器最有信心的样本。就是使用鉴别器 $D$ 计算的分数并对分数进行排序，得到最好的样本(如上图所示)。

Cross-modal Hallucination for Fe
Cross-modal Hallucination for Few-shot Fine-grained Recog...
NeurIPS 2021：Learning with Noisy
论文标题：Learning with Noisy Correspondence for Cross-modal M...
Villanelle 2: Awakening
From love’s hallucination up I’ll wake confounded, yet ha...
cross-modal similarity hashing
原文：Data fusion through cross-modality metric learning usi...
codis 小结（配置）
通过codis-fe进行web操作管理：注意在fe上添加的时候需要保证这些进程存在，fe不会自动开启，只是对这些已...
词为我用 - barefaced
词汇释义 barefaced UK /ˈbeə.feɪst/ US /ˈber.feɪst/ TEM8IELTS...
Untitled
fe # fjoe
Apache Doris——安装部署之扩容缩容
1. FE 扩容和缩容可以通过将 FE 扩容至 3 个以上节点来实现 FE 的高可用。用户可以通过 mysql...
li fe
chi fe
哈哈