美文网首页
2021CVPR-CausalVAE: Disentangled

2021CVPR-CausalVAE: Disentangled

作者: andyham | 来源:发表于2021-04-03 16:57 被阅读0次

作者以及单位

杨梦月 / 伦敦大学学院博士生 (同时在诺亚方舟实验室)
B 站直播https://www.bilibili.com/video/av802324656/
文章下载:https://arxiv.org/abs/2004.08697

解决问题

原作者是以图像的分析出发,但本文逻辑安排,参考了推荐系统场景。

介绍前先引入2个background:

如果(左)z0表示天鹅的位置,z1的值表示天鹅的数量,z2表示湖面大小,当分辨出来的物理概念z0,z1(右)等等,拼接起来,就是解耦表征。同时可以更改其中概念形成新的图片。


f1-解耦表征

针对损失函数来说是让左边的尽量能够还原为右边的x。


f2-xzx

本文解决的问题是:作者认为这些z0,z1之间不是独立的,是具有因果联系的(过往工作没有这样的假设)。核心工作是找到发现这些因果联系的概率,尽可能还原表征。针对目标函数中,就是优化上图q和p的工作。

研究动机

与其他方法核心区别在于在已有的encoder和deconder之间加入了mask(核心工作),分析了因果效应后,可以通过mask层把因果关系传递到他的子节点上面。

f3-mask

研究方法

与以往工作的区别在于虚线框出来的部分。而原本的q和p是无法采样的,所以设计了两种方式分别对qp采样,实现方法设计如下。


f4-intractable

是否可以在推荐系统的损失函数中也加入q和p的考虑?

此外,学习过程中,还有一些需要约束条件要设计,保证学习的过程中学习的因果关键是真正的因果,约束如f3所示,要保证z4的因果传递改变到它的子节点上面。
但是这个过程有一些技巧,不光只能是关注在encode的z4到decode的z4,这个mask的修改可能还会影响decode中z1-z4.(我觉得这个可以考虑在推荐系统中

f5-约束
其实在这个部分,我看文章还做了很多论证,证明设计的这个mask不会反向的传播到它的父节点上面。

作者不光只输入了图片信息,还输入了一个监督信息u,这个u就是因果关系的特征。例如文章最后用了f6中的光照钟摆效果,她把“阳光的位置”,“钟摆的角度”,“影子的位置”,“影子的长度”,这4个标注拼成一个额外的监督信号,输入到目标函数中。

f6-result

创新点

神经因果模型做表征任务,并且用因果关系建模而不是独立建模;和其他工作差别很大,可能是被cvpr收录的原因,考虑了结构(因果)建模,或者结构描述的方法(可以应用到推荐中)。


contribution

结论

在直播中作者谈到了很多应用,我关注了在推荐系统中,作者说可以作为数据生成器,如movielens中是否可以发现因果关系,去除一些不必要的信息。但我觉得可能可以直接修改模型。把因果关系作为正则项或者embedding的包裹层。

作者也提到了她的弱点是,这个模型一定要输入监督信息u(上面研究方法提到,我觉得这个地方也是值得研究的点),如果没有就做不了。她未来工作是用半监督学习也可以实现因果表征的学习。

参考

关于VAE介绍:
VAE: variational autoencoder.变分自动编码器的介绍https://zhuanlan.zhihu.com/p/57574493
有人在github上整理了VAE所有的文章(包含本文)
https://github.com/ComplexData/Awesome-VAEs

相关文章

网友评论

      本文标题:2021CVPR-CausalVAE: Disentangled

      本文链接:https://www.haomeiwen.com/subject/isrhkltx.html