分类
逻辑回归算法(Logiistic Regression)目前最流行,使用最广泛地一种学习算法。
使用分类算法的例子:
- Email的垃圾邮件分类问题:区分邮件是否为垃圾邮件。
- 肿瘤分类问题:区分肿瘤是恶性还是良性。
在所有这些问题中,预测的变量 y 可以去两个值:0、1。
0:“负类” 1:"正类"
二元分类
逻辑回归算法(Logiistic Regression)性质就是适用于 y 值为离散值的情况,并且它的输出值保证在 0 到 1 之间:
假设函数表达式
S型函数(Sigmold Function) 逻辑函数(Logistic Function):
S型函数因此得到:
对假设函数的进一步理解
在给定的特征x的情况下,y=1 的概率,其中θ为参数。
决策边界(Decision Boundary)
假设函数:
对应的图像:
逻辑函数- 如果 ,认为 y = 1
- 如果 , 认为 y = 0
根据图片得出:
- 当 时, ,满足 y = 1
- 当 时, ,满足 y = 0
即:
- 当 时,y = 1
- 当 时,y = 0
例1
Decision Boundary假设如上训练集,假设函数为:
假设已经拟合好数据,并且得到 、 、 ,意味着:
可得到:
- 当 时,满足 y = 1
- 当 时,满足 y = 0
因此,当 时,可得到一条直线:
决策边界上面绘制的 这条直线被称为决策边界。
实例2
Non-linear decision boundaries假设如上训练集,假设函数为:
假设已经拟合好数据,参数向量:
这也说明,若期望 y 满足 y = 1,那么 , 需满足:
决策边界上面绘制的 这条直线被称为决策边界。
对于更复杂的假设函数:
它的决策边界可能会是一些有趣的形状:
决策边界
网友评论