美文网首页ML&DL
机器学习基石笔记:07 The VC Dimension

机器学习基石笔记:07 The VC Dimension

作者: cherryleechen | 来源:发表于2019-04-30 16:12 被阅读15次

一、VC维

N\ge2k\ge3时,易得:m_H(N)N^{k-1}给bound住。

图1.1 限界函数的上限
图1.2 不等式的右值更新
图1.3 学习的可行性分析

VC维:最小断点值-1H能shatter的最大k值。
这里的k指的是存在k个输入能被H给shatter,不是任意k个输入都能被H给shatter。如:2维感知机能shatter平面上呈三角形排列的3个样本点,却shatter不了平面上呈直线排列的3个样本点,因为当另外2个点标签值一致时,中间那个点无法取与它们相反的标签值。若无断点,则该H下,VC维为无穷。所以,存在断点即可以推出有限VC维。

图1.4 VC维的定义
图1.5 常见假设集对应的VC维

d维感知器算法下,VC维=d+1?!

图1.6 感知器的VC维

证明如下:

图1.7 证明1
图1.8 证明2
  • D的大小为d+1时,
    对于矩阵X,易得X(d+1)*(d+1)的矩阵,X的秩小于等于d+1
    所以,存在X,行向量之间线性无关,每一行向量可取任意标签值。
    因此,H能shatter这个X对应的d+1个样本点,即VC维\ge d+1
  • D的大小为d+2时,
    对于矩阵X,易得X(d+2)*(d+1)的矩阵,X的秩小于d+2
    所以,任意X,总有一行与其他行向量线性相关,该行的标签值受到限制。
    因此,H不能shatter这个X对应的d+2个样本点,即VC维\le d+1

综上所述,易得对于d维感知器,其VC维=d+1

二、VC维的意义

VC维,反映的是H的自由度,可粗略认为是自由参数的个数(不总是)。

图2.1 VC维的意义1
图2.2 VC维的意义2

VC维增大,E_{in}减小,模型复杂度增大;VC维减小,E_{in}增大,模型复杂度减小。

图2.3 VC维与模型复杂度1
图2.4 VC维与模型复杂度2
图2.5 VC维与模型复杂度3
图2.6 VC维传达的信息

给定差异容忍度\epsilon、概率容忍度\delta、VC维,求满足条件需要多少样本。
理论上,N约等于10000倍的VC维;实际上,N取10倍的VC维就足够了。

图2.7 样本量需求

可见,VC维是十分松弛的,

  1. 使用霍夫丁不等式,不管f、输入分布P
  2. 使用成长函数,不管具体的D
  3. 使用N的多项式,不管H(VC维相同);
  4. 使用联合bound,不管A

之所以使用VC维是为了定性分析VC维里包含的信息,而且它对所有模型都近似松弛。

图2.8 VC维的使用意义

相关文章

网友评论

    本文标题:机器学习基石笔记:07 The VC Dimension

    本文链接:https://www.haomeiwen.com/subject/wdbmnqtx.html