暴力的黑盒对抗样本攻击 -- ZOO

暴力的黑盒对抗样本攻击 -- ZOO

作者: Mezereon | 来源:发表于2021-04-06 20:31 被阅读0次

暴力的黑盒对抗样本攻击 -- ZOO
AI安全笔记
针对语义分割的真实世界的对抗样本攻击
一文详解对抗训练方法
神经网络中的对抗攻击与对抗样本
对抗攻击方法汇总（持续更新）
关于对抗样本需要知道的
Adversarial Examples
2018-12-14
对抗样本和对抗训练笔记------简述

介绍

这次来介绍一篇CCS Workshop 2017的工作，"ZOO: Zeroth Order Optimization Based Black-box Attacks to Deep Neural Networks without Training Substitute Models"

对抗攻击

这是一个黑盒的对抗样本攻击，如上图所示，攻击者只能进行输入，并且获得置信度的输出，不能对模型进行反向传播。

有关于白盒的对抗样本攻击，可以查看我这篇文章

不能反向传播，会导致对抗样本难以生成。那么怎么进行攻击呢，有一些工作的思路是训练一个替代模型（substitute model）来进行攻击。

替代模型是指利用类似分布的数据集，或者利用多次输入输出的结果，训练一个新的模型，并在新的模型上进行反向传播，进而得到一个对抗样本。

强行计算梯度

正如之前所说，没办法进行反向传播，梯度都没办法直接计算。

那么该工作便强行计算了一个伪梯度，我们来看看细节

首先我们先对输入 $x$ 进行一个扰动 $x = x + h\cdot e$

其中 $h = 0.0001$ 是一个常量值， $e$ 是一个标准单位向量，你可以理解为某一位为1其余都是0的向量。

我们记模型的输出为 $f(x)$ ，那么利用对称差分，可以得到一个估计梯度值
$\tilde{g} = \frac{\partial f(x)}{\partial x} \simeq \frac{f(x+h\cdot e) - f(x-h\cdot e)}{2h}$
同时，我们可以估计出二阶的梯度值
$\tilde{h} = \frac{\partial^2 f(x)}{\partial x^2} \simeq \frac{f(x+h\cdot e) - 2f(x) + f(x-h\cdot e)}{h^2}$

有了这两个梯度估计值，就可以直接对 $x$ 进行梯度下降优化了。比如牛顿法，那么则是
$x = x - \eta \frac{\tilde{g}}{\tilde{h}}$
其中 $\eta$ 是学习率

同理可以得到Adam的过程，这里不多赘述。

algorithm-Newton

如上图所示，算法会迭代数次，在每一次迭代的时候，随机选取一个像素位置，添加扰动并计算出梯度，多次迭代之后得到结果。

结果分析

cifar and mnist

作者在手写数据集MNIST和CIFAR10上进行测试，和白盒攻击C&W，以及替代模型方法进行了对比。

从时间上看，黑盒攻击要更加花费时间，成功率也会有所下降

相关文章

暴力的黑盒对抗样本攻击 -- ZOO
介绍这次来介绍一篇CCS Workshop 2017的工作，"ZOO: Zeroth Order Optimiz...
AI安全笔记
对抗攻击术语 l对抗图像/对抗样本（Adversarial example/image）对抗样本是对干净图像进...
针对语义分割的真实世界的对抗样本攻击
针对语义分割的真实世界的对抗样本攻击来自于论文"Evaluating the Robustness of Sem...
一文详解对抗训练方法
对抗训练方法 Adversarial learning主要是用于样本生成或者对抗攻击领域，主要方法是通过添加鉴别器...
神经网络中的对抗攻击与对抗样本
对抗攻击对抗攻击论文参考：《Intriguing properties of neural networks》《...
对抗攻击方法汇总（持续更新）
自从2014年Szegedy等人提出对抗样本以来，不断有研究者提出新的对抗攻击方法。本文汇总了当前已有的绝大多数算...
关于对抗样本需要知道的
什么是对抗样本 Adversarial Examples(对抗样本)：对输入样本故意添加一些人无法察觉的细微的干扰...
Adversarial Examples
对抗样本概念特点 1 对抗样本是正确样本2 是普通样本经过一些变换得到的与原始样本相差很小. 但是会误导神经网...
2018-12-14
出席：陈相全罗怡妃段富程地点：图书馆一楼 1.今天将PyCon2018｜用对抗样本攻击PNASNet模型(附...
对抗样本和对抗训练笔记------简述
最近主要在看对抗样本，对抗训练相关的论文，在此写一下个人的一些理解，有些想法不是很成熟，欢迎交流。什么是对抗样本...

网友评论

本文标题：暴力的黑盒对抗样本攻击 -- ZOO

本文链接：https://www.haomeiwen.com/subject/aueekltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

机器学习与深度学习

热点阅读

机器学习与深度学习

简友广场

关于我们|服务条款|联系我们|暴力的黑盒对抗样本攻击 -- ZOO|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！