美文网首页
Active learning 主动学习与统计模型

Active learning 主动学习与统计模型

作者: 波洛的汽车电子世界 | 来源:发表于2018-09-22 04:20 被阅读0次

    今天看了下论文Active Learning with Statistical Models,下面的内容都是来自于它。

    题外话: 机器学习里面的learner是什么意思?当研究者说构建模型的时候,他们会把这个“machine”说成learner,当预测的时候,他们会说classifier/regressor。

    主动学习是指学习器(learner)有能力选择或者影响选择它的训练数据。
    问题描述:有训练数据集(x,y),learner能够迭代的选择新的输入x^*,并且观察他的预测y*,满足条件,就将(x^*,y^*)加入训练数据集。那么,怎么选择x^*
    有很多思路:例如,我们可以选择我们还没有选过数据的地方,或者是lerner效果表现不好的地方,或者是置信度低的地方,或者是可以改变我们的模型的地方等等。

    这篇文章讲的是怎么从统计学的角度来最优的选择x^*

    1. 统计方法是如何应用到神经网络的?

    我们把输入x对应的输出写作y(x),它的均方误差(MSE)可以表示为学习器的偏移和方差之和。方差\sigma_y^2(x)表示的是learner在估计x时的不稳定性。
    我们的目标是选一个新的数据x^*,预测y^*,并将(x^*,y^*)加入训练集,此时方差IV最小。
    IV = \int \sigma_y^2P(x)dx
    这儿P(x)就是就是指x的分布,通常是已知的。IV可以用蒙特卡洛方法算出来。
    x^*以及最小化IV需要计算(\sigma_y^*)^2。很多模型在已有的数据的基础上对P(y^*|x^*)作出估计,从而算出(\sigma_y^*)^2
    用最小化方差来选择x^*为选择新的数据提供了坚实的统计基础。

    1. 两种替代方法:Mixtures of Gaussians ; Locally weighted regression。
      2.1 高斯模型混合(Mixtures of Gaussians): 假设数据是由N个高斯模型g_i (i = 1,...,N)的混合模型产生的,我们可以用EM算法来找到数据最匹配的模型,然后用混合模型的条件期望就可以做函数估计。
      对每个高斯模型g_i,我们把预估的输入输出的平均值写作\mu_{x}\mu_{y},预估的协方差写作\sigma_{x,i}^2, \sigma_{y,i}^2\sigma_{xy,i}。给定xy的条件方差可以写成:
      \sigma_{y|x,i}^2 = \sigma_{y,i}^2 - \frac{\sigma_{xy,i}^2}{\sigma_{x,i}^2}
      我们将n_i设为g_i模型训练数据的个数。
      对于一个输入x,每个g_i的条件期望\hat{y_i} 和方差\sigma_y^2可以写出:
      \hat{y_i} = \mu_{y,i} +\frac{\sigma_{xy,i}}{\sigma_{x,i}^2}(x - \mu_{x,i})
      \sigma_{\hat{y},i}^2 = \frac{\sigma_{y|x,i}^2}{n_i}(1+\frac{(x - \mu_{x,i})^2}{\sigma_{x,i}^2})
      我们想要用最小化{\sigma_y^*}^2来选择x^*。给定x^*条件下y^*的估计分布可以写成下面的形式:
      P(y^*|x^*) = \sum_{i = 1}^N h_i^* P(y^*|x^*,i) = \sum_{i = 1}^Nh_i^*N(\hat y(x^*),\sigma_{y|x,i}(x^*))
      h_i^* \equiv h_i^*(x) = \frac{P(x|i)}{\sum_{i = 1}^NP(x|j) }

    这样,{\sigma_y^*}^2就可以算出来了:我们分别对每个g_i的变化建模,对从P(y^*|x^*,i)给定的新的数据计算出它的期望的方差,并且给出它的权重变化h_i^*。新的期望组合起来就是learner的新的方差:
    \sigma_{\hat{y}}^2 = \sum_{i=1}^N\frac{{h_i^*}^2\sigma_{y|x,i}^2}{n_i+h_i^*}(1+\frac{(x - \mu_{x,i})^2}{\sigma_{x,i}^2})
    2.2 Locally weighted regression本地权重回归
    这个方法暂时不是很感兴趣,就不说了。

    相关文章

      网友评论

          本文标题:Active learning 主动学习与统计模型

          本文链接:https://www.haomeiwen.com/subject/ckstoftx.html