Show, Attend and Translate: Unsu

Show, Attend and Translate: Unsu

作者: EwanRenton | 来源:发表于2018-08-24 15:45 被阅读0次

Show, Attend and Translate: Unsu
Show, Attend and Read:A Simple a
序列建模（四）：CV_Attention
再读Faster RCNN
论文学习5“Show, Attend and Tell: Neu
Unsupervised Attention-guided Im
pathetic
YOYO词根词缀学习23
Swift Error Collection
哪一句，触动了你?

本文提出了一种结合Attention机制和self-Regularization的无监督图像域转换模型。

问题

为了解决两个域间的图像转换问题，需要学习从一个域到另一个域的映射，将X域中的图像转换到Y域。
本文的目的是使生成的图像看起来和源图像(X域)是相似的，同时具备Y域图像的特征。

如上图所示，图像从Horse域转换到了Zebra域，但是背景部分并没有变化。

方法

由于现在的图像转换方法经常会对图像作一些多余的修改，于是作者提出加入一个attention模型来预测一个attention map来指导图像转换。

模型结构如上图所示。
生成器G包含了两个部分，常见的生成器G-0和attention部分G-attn。
G-0负责将输入图像x转换到Y域，G-attn负责预测一个 attention mask。其中G-attn(x)和x同纬度，并且每个像素点都是一个0-1的概率值。
最后在根据G-attn(x)将x,G-0(x)相加得到G(x)，之后会具体介绍是怎么加的。

Loss

生成器loss

其中

G-attn(x)即attention mask表示每个像素需要attend的概率，G-attn(x)G-0(x)就从转换过后的图像中取出attend的部分（前景），(1-G-attn(x))x就从原图像中得到了不被attend的部分(背景)，将两者加起来就得到了最后的输出。
再回到本文的生成器loss，loss由两部分构成对抗loss L-adv和自正则化loss L-reg。

判别器loss

判别器loss就是常见的GAN中的判别器loss

同样生成器loss L-adv就是

自正则化loss Self-regularization loss

加入自正则化可以使生成的图像和原图保持视觉上的相似，即保留原图的低纬特征。例如颜色，性质，轮廓等。
自正则化被定义为最小化生成图像和原图的距离，这个距离可以是L1，L2或者SSIM等。
所以生成器L-reg定义为

F是在IMageNet上预训练的VGG网络，用来提取特征。
其中H和W表示不同层，即在多层上做自正则化。
作者提出取前三层能取到最好的效果，并且w1,w2,w3分别取1.0/32,1.0/16，1.0/8。

训练方式

首先单独训练G-0
保持G-0不动，训练G-attn
jointly fine-tune G-0和G-attn

Adaptive weight induction

生成器loss中L-reg前面有一个 λ，一般这个都是作为超参数手工设置的，本文作者采用了一种自适应的方法。
首先设置 λ为0
之后逐步增大 λ
当对抗loss 降低到某个值过后停止增大 λ
继续训练直到收敛
作者说这种方式能够找到较好的 λ，但是原因没有说的很清楚。

具体实现

G-0

由三部分组成，下采样，残差块，上采样层
前部分下采样层包括两个卷积 stride为2
中间部分是 9个残差块保持height/width不变
末尾部分两个反卷积 stride为2
每个卷积后面都跟了 batch normalization和Relu

G-attn

G-attn由初始VGG(取到conv3_3)构成,然后跟了两个分卷积，最后是一个卷积和sigmoid。

Discriminator

5层卷积
前三层stride为2后两层为1
输出是一个判断real/fake的向量

更多细节请看论文地址
目前代码还没有开源出来。

Results

相关文章

Show, Attend and Translate: Unsu
本文提出了一种结合Attention机制和self-Regularization的无监督图像域转换模型。问题为...
Show, Attend and Read:A Simple a
Show, Attend and Read:A Simple and Strong Baseline for Ir...
序列建模（四）：CV_Attention
[Show and Tell 中文博客参考link][Show, Attend and Tell 中文博客参考li...
再读Faster RCNN
在image caption 这个任务中，论文“Show, Attend and Tell: Neural Ima...
论文学习5“Show, Attend and Tell: Neu
这篇文章是2015年ICML上的一篇文章，把attention机制引入到图像领域的文章，作者Kelvin Xu 、...
Unsupervised Attention-guided Im
本文和上一篇show,Attend一样，都是基于attention机制的图像转换。两篇文章的工作大体是相似的，但是...
pathetic
something or someone that is pathetic is so useless ,unsu...
YOYO词根词缀学习23
七十九、tend，tens，tent= stretch，strive 伸展；奋力 1）attend （attend...
Swift Error Collection
error1 Showing Recent MessagesSWIFT_VERSION '*.0' is unsu...
哪一句，触动了你?
关于成功 1. Behind every successful man there's a lot of unsu...

网友评论

本文标题：Show, Attend and Translate: Unsu

本文链接：https://www.haomeiwen.com/subject/nrtiiftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Show, Attend and Translate: Unsu|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！