1.首先介绍在线学习的相关概念
在线学习是在一系列连续的回合(rounds)中进行的:
在回合,学习机(learner)被给一个question:
(一个向量,即为特征向量),
为从instance domain:
采样得到的。学习机给出一个预测值:
,然后得到正确的答案:
,
从target domain:
采样得到。
定义损失函数为。在大多数情况下,
在
中,但是,允许学习者从更大的集合中选择预测有时很方便,我们用D表示prediction domain。下图展示了在线学习框架:

网友评论