Defending Adversarial Attacks by

Defending Adversarial Attacks by

作者: 馒头and花卷 | 来源:发表于2020-09-10 22:29 被阅读0次

Li Y., Xie L., Zhang Y., Zhang R., Wang Y., Tian Q., Defending Adversarial Attacks by Correcting logits[J]. arXiv: Learning, 2019.

概

作者认为, adversarial samples 和 natural samples的分布是不同, 结果二者的输出logits的分布也是不同的, 那么能否通过此来还原正确的类别呢?

在这里插入图片描述

主要内容

在这里插入图片描述

思路是这样子的, 假设原本的网络为 $f(\cdot)$ , natural样本 $x$ 和adversarial样本 $x'$ 分别得到 $z$ 和 $z'$ , 根据假设(发现)二者的分布是不同的. 构建一个新的判别器 $g(\cdot)$ , 将 $z$ 和 $z'$ 作为新的输入, 自然我们希望natrual样本的 $z$ 的输出还是 $g(z)=z$ , 而adversarial样本的 $z'$ 被转换为 $g(z')=z$ . 如果能够做到, 那么 $g(\cdot)$ 就成为了一个防御手段.

实验发现, 这种想法是有效的, 且效率非常高, 甚至能够提高clean accuracy !

实验

论文没有开放代码, 个人的实验结果不是很理想, 当然可能和在小数据集上跑有关系. 另外论文没有说清楚adversarial samples是如何构造的. 因为如果是单纯通过原有的网络构造对抗样本再利用 $g(\cdot)$ 恢复是不可靠的, 应该在 $g \circ f$ 的基础上构造.

相关文章

网友评论

本文标题：Defending Adversarial Attacks by

本文链接：https://www.haomeiwen.com/subject/vepmektx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Defending Adversarial Attacks by|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！