[论文阅读] 2017-ICCV-Universal Adver

作者: 带刺的小河豚 | 来源:发表于2019-12-03 21:45 被阅读0次

[论文阅读] 2017-ICCV-Universal Adver
GAN模型初步总结
EZ | AutoGAN-Distiller：做神经网络结构搜索
idfv和idfa有什么区别
Advertising means nothing?
Introductory Materials
oracle日常使用出现的问题及总结
SeqGAN:Sequence Generative Adver
Moz the Monster: Christmas adver
kafka0.10 broker配置

语义分割应用场景：

自动驾驶（Autonmous Driving）

面部分割（Facial Segmentation）虚拟改造

室内实体分割（Indoor Object Segmentation）AR、VR技术

地理板块感知（Geo Land Sensing）防风护林

摘要

深度学习在视觉任务上应用很成功，但也容易受到来自输入的对抗干扰
- 这种扰动被定义为添加到输入的噪音，人类无法觉察，然而可以欺骗神经网络
- 不仅如此，通用的干扰也存在
近来的工作都集中在图片分类上，本文工作针对图片的语义分割
- 展示了一种生成通用干扰的方法，使得网络输出指定的分割结果

1. Introduction

图片语义分割重要性
- 对于自动驾驶、视频监控、机器人技术中感知场景的重要方法
  - 通过移除所有行人欺骗刹车器
物理世界的对抗攻击
- 物理可行，且人类不易发觉
  - 物理可行，即输入是事先（在对抗干扰生成前）不可知的
通用对抗干扰
- Moosavi-Dezfooli-Dezfooli提出
- 本文将其延伸扩展到语义分割领域
干扰的不易察觉
- 通过移除所有行人，从而欺骗制动系统。那么需要保持对所有其他类别的预测不变而只隐藏目标类别
  - 本文提出动态定向分割场景（Dynamic target segmentation scenario）
- 对于任意场景，均输出指定的分割结果
  - 本文提出静态定向分割场景（Static target segmentations）
  - 隐藏小偷盗窃活动
贡献
- 证明通用对抗样本在语义分割中的存在性（定向攻击场景）
  - 图像语义分割的对抗扰动空间可能比图像分类识别的空间小
- 提出两种通用对抗样本生成方法
  - 一种方法的目的是生成指定的对抗样本
  - 另一种方法的目的是移除指定类别而保持其他部分不变
- 证明其迁移性
  - 可从小数据集上训练，泛化至其他数据
- 定向扰动与目标场景具有相似的局部结构

2. Background

定义声明
- $f_\theta(x)$ ：参数为 $\theta$ 的网络分类器 $f$ ，对输入 $x$ 所产生的输出，即 $p(y|x;\theta)$ ，类别概率向量
- $y^{true}$ ：真实标签，one-hot编码的类别
- $J(f_\theta(x),y^{true})$ ：分类器基本损失（如交叉熵损失）

2.1 图像语义分割

图像语义分割被定义为一个稠密的预测任务
- What is where in an image?
- 需要为图像中的每个像素分配一个类别标签
- 神经网络中，采用最棒的FCN-8s网络（基于VGG16模型），包含两部分
  - 编码部分，将输入图片转换为低分辨率语义表示（在ImageNet上训练好的VGG16，最后几个全连接层被重新修改为卷积层）
  - 解码部分：提高定位精准度，并在输入图像分辨率下产生最终语义分割

2.2 对抗样本

定义声明
- $\xi$ ：扰动量
- $x^{adv}=x+\xi$ ：对抗样本
对抗样本发展
- Szegedy提出L-BFGS
- Goodfellow提出FGSM
- Kurakin扩展FGSM，提出BIM、LLM
- （上述方法中扰动量 $\xi$ 均基于输入 $x$ ）
- Moosavi-Dezfooli提出通用对抗样本（Universal，迭代使用DeepFool）
  - 不足，此类攻击时非定向的

3. 图像语义分割中的对抗样本

定义声明
- $J_{ss}(f_\theta(x),y)=\frac{1}{|\mathcal{I}|}\sum\limits_{(i,j)\in{\mathcal{I}}}J_{cls}(f_\theta(x)_{ij},y_{ij})$ ：损失函数
- $\min\limits_{x^{adv}} J_{ss}(f_\theta(x^{adv}),y^{target})$ ：目标函数

3.1 对抗目标类别生成

原则上， $y^{target}$ 可以随便选
但实际上，攻击者可能不会根据 $y^{true}$ 选 $y^{target}$ ，应为攻击者也不知道 $y^{true}$ 是什么
通常来讲，攻击者会使用 $y^{pred}=f_\theta(x)$ 作为基准（假设攻击者可以获取 $f_\theta$ ）
本文定义两种方法来生成定向攻击分割结果
- Static target segmentation
  - 攻击者预先定义一个固定的分割结果（ $t_0$ 时刻）作为目标分割结果
  - $y^{target}_t=y^{pred}_{t_0}\forall t>t_0$
  - 攻击那些基于静态摄像头的系统，攻击者希望隐藏可以活动
- Dynamic target segmentation
  - 在涉及自我运动的情况下，static方法不适用，因为它为考虑场景中由于相机运动产生的变化
  - Dynamic方法目标就是除去指定实体，保持网络其他实体分割结果不变
  - $o$ ：网络中攻击者想隐藏的实体类别
  - $\mathcal{I}_o=\{(i,j)|f_\theta(x_{ij})=o\}$
  - $\mathcal{I}_{bg}=\mathcal{I}\setminus\mathcal{I}_o$
  - $y^{target}_{ij}=y^{pred}_{ij}$ for all $(i,j)\in\mathcal{I}_{bg}$
  - for all
    - $i^{'},j^{'}=\arg\min\limits_{i^{'},j^{'}}(i^{'}-i)^2+(j^{'}-j)^2$

3.2 针对图片的干扰

声明定义
- 给定 $y^{target}$
- $\xi_{adv}=\arg\min\limits_{\xi^{'}}J_{ss}(f_\theta(x+\xi^{'}), y^{target})$ ：目标函数
- $|\xi^{'}_{ij}|\le \epsilon$ ：约束条件
静态定向迭代干扰
- $\xi^{(0)}=0$
- $\xi^{n+1}=Clip_{\epsilon}\{\xi^{(n)}-\alpha sgn(\nabla_xJ_{ss}(f_\theta(x+\xi^{(n)}),y^{target}))\}$
动态考虑背景的定向迭代干扰
- - $\omega$ =1时，攻击者仅关注移除目标类别
  - $\omega$ =0时，攻击者仅关注保持目标类别

3.3 通用干扰

声明定义
- 包含m个实例的训练集：
  - $y^{target,k}$ 由3.1中的方法生成
通用干扰迭代生成方法
- $\Xi^{(0)}=0$
- - $\nabla^{\mathcal{D}}(\Xi)=\frac{1}{m}\sum^m_{k=1}\nabla_xJ^{\omega}_{ss}(f_\theta(x^{(k)}+\Xi), y^{target,k})$ 为在整个训练集上的平均损失梯度，容易出现过拟合
  - 如何防止过拟合怎么看懂。。。

4. 实验结果

实验设置
- 数据集：Cityscapes dataset（3475张公开有标签图片，每张图片2048*1024像素，来自44个不同城市，2975张训练，500张验证）
- 预处理：将图片缩放至1024*512像素（双线性差值算法），使用最邻近算法来进行下采样
- 网络模型：FCN-8s来实现图像分割
- 效果：在所有训练集上训练，在验证集上获得64.8%的交并比
- 超参数设置： $\epsilon=10$ ，迭代次数60
Static Target Segmentation
- Ciryscapes数据集不包含静态数据，文章选择了一张与原始图像毫无关系的的目标分割结果
- 用于训练的数据为2975张图片，使用不带 $\omega$ 权重的损失函数 $J_{ss}$ ，未使用periodic tiles
- 使用在训练集上生成的通用对抗扰动，在测试集上攻击效果几近完美
- 真是图像中低对比度的比高对比度的噪音结构影响更明显
- image-20191127192914333.png
- 定量分析与成功率关系
  - image-20191127193229059.png
Dynamic Target Segmentation
- 攻击者目的为尝试隐藏图片中的行人类别，并保持其他部分尽量不变
- 用于训练的数据为1700张图片，periodic tile尺寸为h=w=512，损失函数 $J^{\omega}_{ss}$ 权重为 $\omega=0.999$
- 结果显示，虽然攻击者成功地删除了几乎所有行人像素，且保持背景基本不变，但稍微仔细检查就能引起怀疑，因为分割看起来并不均匀
- image-20191204204645530.png
- 噪声 $\epsilon$ 对分割结果的影响
- image-20191204205249985.png
- 权重 $\omega$ 对分割结果的影响
- image-20191204205603473.png
泛化性
- 在CityScapes数据集上训练对抗扰动，在CamVid数据集（与CityScapes相似）上测试
  - 静态定向分割中，平均78%的像素攻击成功
  - 动态定向分割中，平均84.5%的行人像素攻击成功，79.6%的背景像素完好保留
- 在FCN网络上训练对抗扰动，在PSPNet网络上测试，静态定向分割攻击
  - 与真实像素的交并比从74.8%降低至8.8%
  - 跨网络时，通用干扰更适合非定向攻击，而不适合定向攻击

[论文阅读] 2017-ICCV-Universal Adver
语义分割应用场景：自动驾驶（Autonmous Driving）面部分割（Facial Segmentat...
GAN模型初步总结
对之前学习的TFGAN库中的各种GAN做一个理论上的总结。 GAN 论文地址是Generative Adver...
EZ | AutoGAN-Distiller：做神经网络结构搜索
AutoGAN-Distiller: Searching to Compress Generative Adver...
idfv和idfa有什么区别
IDFV (Identifier for Vendor) 和 IDFA (Identifier for Adver...
Advertising means nothing?
s://zhuanlan.zhihu.com/p/31607971/edit Amazed-------Adver...
Introductory Materials
1. in command of 掌控，指挥 2. arguably adv. [sentence adver...
oracle日常使用出现的问题及总结
①包括占位符插入日期 sql = "insert into tb_adver(iaid,ctitle,ctype,...
SeqGAN:Sequence Generative Adver
论文：SeqGAN代码：Github 这篇paper主要介绍了GAN在文本生成上的应用。GAN在2014年被提出之...
Moz the Monster: Christmas adver
又到一年英国圣诞购物季--创意广告诞生的高峰期。面对海量的信息，百货公司John Lewis总能因“走心”、“有爱...
kafka0.10 broker配置
broker.id:1 集群唯一ID,手动维护 listeners=PLAINTEXT://:9092 adver...