在线性回归中,要求:因变量必须是连续变量,不能是分类变量。如患病-不患病、是-否、健康-不健康、好-坏等等分类变量时,线性回归就无法计算。而logistic回归就是为了解决这个问题的,它主要用于因变量是二分类变量时对多个自变量进行拟合回归的常用方法。比如,需要使用小鼠体重对小鼠是否肥胖进行拟合,那么就可以使用logistic回归。
Logistic回归Logistic回归会使用一种概率转换的方法,如上图所示,logistic回归的曲线是一个中间非常陡直的“S"形曲线,拟合出来的logistic曲线是一个概率分布图,如果概率>0.5则是肥胖,如果概率<0.5则是不肥胖。
由于概率在0-1之间是连续的,所以也就相当于将离散变量转变为连续变量了。
同线性回归一样,自变量是不限制变量类型的,离散变量和连续变量都没有问题。不同于线性回归的最小二乘法,logistic回归是使用的是极大似然法,所以logistic回归是没有残差的概念的。
网友评论