分类问题
在分类问题中,你要预测的变量 是离散值
分类问题的例子有:判断一封电子邮件是否是垃圾邮件;判断一次金融交易是否是欺诈;之前我们也谈到了肿瘤分类问题的例子,区别一个肿瘤是恶性的还是良性的
从二分类开始
可能属于的两个类分别称为负向类(negative class)和正向类(positive class),则因变量 ,其中 0 表示负向类,1 表示正向类
如果将threshold设为0.5,则假设函数>0.5时,将样本判断为1
二分类问题的问题
对于分类问题, 取值为 0 或者1,但如果使用的是线性回归,那么假设函数的输出值可能远大于 1,或者远小于0,但是我们希望分类器的输出值在0和1之间
S型函数/逻辑函数,该模型的输出变量范围始终在0和1之间
S型函数/逻辑函数的图像是
在S型函数下,逻辑回归模型的假设函数
此时的作用是对于给定的输入变量,根据选择的参数计算输出变量==1的可能性,即。如果对于给定的,通过已经确定的参数计算得出,则表示有70%的几率为正向类
网友评论