@article{koh2017understanding,
title={Understanding black-box predictions via influence functions},
author={Koh, Pang Wei and Liang, Percy},
pages={1885--1894},
year={2017}}
概
本文介绍了如果计算(估计)损失关于样本的一些影响因子, 并介绍了一些应用范围.
主要内容
假设样本, , 通过最小化经验损失
找到最优解.
且假设关于样本和参数都是二阶可导且强凸的.
样本重要性分析
显然, 此时给定一个测试样本, 其对应的损失为, 那么衡量一个样本重要性的一个重要指标便是, 倘若在移除样本的情况下重新训练模型, 对应的参数和损失的变化.
假设在移除样本的情况下训练得到的最优参数为, 并引入
易得.
则
其中.
我们可以得到, 参数的变化量的一阶近似
进一步, 我们定义损失的变化量
样本摄动对损失的影响
倘若我们对其中一个样本添加一个扰动, 并在新的数据上训练, 得到模型, 其参数和损失会如何变化?
我们定义
并令
同样可以证明
则
故
注:文章这里没有且是等号(我卡在这个地方了, 推不出来).
高效计算
共轭梯度
此时我们不是计算, 而是计算, 比如在计算的时候, , 则对于固定的想要知道不同的的影响可以直接用, 避免了重复运算.
即求解
假设第步为
则利用精确直线搜索
得
随机估计
这里是估计, 为了符号简便省略下表, 因为, 用表示前项的和, 易知
我们从样本中均匀挑选, 计算 作为的替代, 则
当然, 处于稳定性的考虑, 我们可以一次性采样多个来作为的替代.
一些应用
- 探索模型关于样本的内在解释, 即什么样的样本模型会更加偏好之类的;
- 生成对抗样本;
- 检测目标数据分布和训练分布是否一致;
- 检测训练数据的标签是否正确.
附录
(1)的证明
定义, 则
由一阶最优条件可知
把看成自变量(固定), 第二个等式右边是关于这个变量的一个函数, 则其在处的泰勒展式为
故
因为, 易知,
网友评论