一、介绍
支持向量机(SVM)进行数据集的二分类,但是有些数据集是线性不可分的,所以需要使用核函数把数据集映射到高维空间,在高维空间中便可以进行分类。
比如下面的场景,是线性不可分的。

使用高斯核可以把数据映射到可分的空间上。

定义
高斯核函数(Gaussian kernel),也称径向基 (RBF) 函数。
上述公式涉及到两个向量的欧式距离(2范数)计算,而且,高斯核函数是两个向量欧式距离的单调函数。 σ 是带宽,控制径向作用范围,换句话说, σ 控制高斯核函数的局部作用范围。当 x 和x′ 的欧式距离处于某一个区间范围内的时候,假设固定 x′, k(x,x′) 随x的变化而变化的相当显著。 当距离大时,高斯核函数接近0,当距离接近0时,核函数接近1,变化区间是0和1。
一维
令x′=0,k(x,0) 随x的变化情况如下图所示:


我们看到,随着x 与x′的距离的距离的增大,其高斯核函数值在单调递减。并且,σ越大,那么高斯核函数的局部影响范围就会越大。
二维

网友评论