Explainable Machine Learning

作者: 单调不减 | 来源:发表于2019-09-29 00:20 被阅读0次

Explainable Machine Learning
Machine learning booooks
00 Machine Learning Introduction
【ML】Machine learning model
Machine Learning @ Python
The Fundamentals of Machine Lear
Coursera.MachineLearning.Week10
周志华推荐阅读材料
Al:what is Al
目录

Explainable Machine Learning意为可解释的机器学习。顾名思义，就是说我们的机器学习模型不仅能够给出正确结果，还要给出理由。

这实际上是对我们的模型提出了更高的要求。如deep learning等效果很好但很复杂的模型通常被视作黑箱，现在我们却试图让模型告诉我们黑箱内到底发生了什么，这无疑是困难的。

好在我们要求的也并不多，拿用于图像识别的神经网络模型来说，我们只需要它给出是通过图像的哪个部分得出结论的即可，或者说对于模型来说图像的哪个部分对结果产生了关键的作用。然后我们可以通过人类的经验来检验机器到底有没有真的学到重要的特征，若没有，则可以有针对性地对模型进行修改。

实际上，很多机器学习模型本身就具有良好的可解释性，比如线性模型，其权重就对应了重要性，比如决策树，我们可以直接回溯分支来解释模型是如何一步步将某个样本分类的。然而这些具有良好解释性的模型在很多时候不足以应对复杂的学习任务。相比之下，深度学习模型可以解决非常复杂的问题，但它的可解释性较差。

现在我们希望可以让深度学习这样的复杂模型也具有一定的可解释性，怎么做呢？

以用于图片识别的DNN模型为例：

我们的idea很简单，就是将图片划分为一系列segment，然后改变某个segment看看会对输出产生多大影响，若影响很大，说明这个segment很重要，反之则说明不重要。

于是我们很自然地想到用梯度来衡量这种影响：

第二行的图中亮度较大的部分对应上图中梯度较大的部分，可以看出分类器之所以判定一张图片为dog，确实是因为检测到了dog（的某些特征），因此我们认为机器确实学到了东西。

李宏毅老师还给出了一个令人笑喷的反例——分辨神奇宝贝和数码宝贝。

分辨神奇宝贝和数码宝贝是人类都非常难以做到的事情，但DNN模型却取得了非常好的表现：

我们不禁好奇，机器到底是通过哪些特征分辨神奇宝贝和数码宝贝的呢？

答案就是……背景颜色……

话说回来，以上我们都是利用梯度来判断图像各部分对图像识别的重要程度的，这样做会不会出现问题呢？

是的，基于梯度的方法也有一些限制：

比如我们模型认为大象的一个重要特征是长长的鼻子，那么大象的信心分数随鼻子长度的变化如图，若现在图片中有一只鼻子超长的大象，那么鼻子部分得到的梯度反而是比较小的，这就不太合理。

解决这个问题的方法请参考相关文献……

以上解决的问题是Local Explanation，即分类器为什么认为一张图片中是一只猫。

接下来我们想要解决一个更加困难的问题，我们的分类器眼中，猫长什么样子。

这就是Global Explanation：

回忆一下介绍CNN的章节，我们试图找出CNN眼中什么样的图片是手写数字，我们使用的方法也很简单，就是让某个输出层神经元的activation之和最大（即这个神经元最大程度被激活），然后固定 $w$ 调优 $x$ ，得到的 $x$ 就是分类器眼中对应这个神经元代表类别的手写数字图片。

左图是雪花，毫无章法，右图加入正则项后稍有好转，大致可以看出各个数字图片的一些特征了。

能不能让模型给出一些它认为是猫的图片呢？要生成逼真的图片，可以使用VAE、GAN等算法。

这个思路把在上述步骤前连接了一个生成器，然后形成一个更深的神经网路，并把最大化 $y$ 作为目标，对某个低维输入 $z$ 进行调优，注意这里的生成器是一个通过大量猫和狗和其他动物的图片（也就是用于训练模型的训练集）使用GAN训练好的生成器，在当前训练过程中权重不变（它只负责生成逼真的图片），而我们模型的权重也不发生改变，调优剩下的权重值得到一张逼真的图片输出 $x$ ，并看一下是不是猫的图片，也可以验证模型有没有真的学到东西。