一、概率上限值的来源
train:根据给定训练集在中选出,使得约等于0;
test:在整个输入空间上的表现要约等于在训练集上的表现,使得约等于。
对于这个不等式来说,
如果小,更易保证test(不等式右式小),难保证train(选择少);
如果大,更易保证train(选择多),难保证test(不等式右式大)。
如果无限呢?可能大于1了,对于概率值上限来说失去意义。那能否用个有限值代替呢?看一下这个上限的来源。
从图1.2中可以看出,求概率上限值的本质是求并集,但是得出这个式子是在默认无交集的情况下求的并集。实际上,确定后,形式也确定。给定,在里存在相似的,这些在上的表现一致,即存在交集。所以,这个式子作为上限来说过大了。
二、成长函数
给定,可通过将里相似分到同类里(同类里的数目可能是无限的),将变为类数,就可能将无限的变为有限的类数。
定义给定下,将分得的类为dichotomies(二分法),每一个dichotomy在上表现相同。假设里有2个样本点,将分为OO、OX、XO、XX的分别归为一类,共有4类。可以发现dichotomies的数量是依赖于具体和的,但是dichotomies的数量的最大值只依赖与里样本点的个数和。例如,在感知器算法中,时,最大值不超过2的次方,这里是4。
定义dichotomies的数量的最大值为的成长函数,记为,其只和、有关。即,给定样本数,里假设类数是小于等于的。例如,对于2维感知机,,,,。
图2.2 成长函数的定义
图2.3 正射线的成长函数
图2.4 正间隔的成长函数
图2.5 常见的假设集对应的成长函数
可以看出,成长函数可能是多项式型的(好的,能保证只要足够大,小),也可能是指数型的(坏的)。那对于2维及以上维数的感知机,成长函数是多项式型的吗?
图2.6 多项式型和指数型成长函数三、断点
shatter(使粉碎):如果里的假设能够保证个输入能够输出任意标签的组合,称能shatter这个输入。
break point :不能shatter这个输入,称为断点。
图3.2 常见的假设集对应的断点值
猜想(conjecture),只要存在断点,就能保证成长函数是多项式型,进而保证了test?!
网友评论