一、二者说明
1.线性回归
线性回归作为统计学领域的一个重要的方法,主要被应用于描述自变量与因变量之间的关系,一般分为一元线性回归以及多元线性回归分析,一元线性回归分析就是指因变量和一个自变量之间的关系,多元线性回归分析因变量和两个或者两个以上自变量之间的关系,线性回归的一般表示形式如下:
其中y为因变量,x1…xk为k个自变量。
-
-
-
相互独立
2.Logistic回归
Logistic(逻辑)回归是一种监督式学习的分类回归算法,本质上与线性回归同属于广义线性模型,在logistic回归中可以直接预测观测相对于某一事件的发生概率。其中logistic回归分析一般包括二元logistic回归分析、多分类logistic回归分析以及有序logistic回归分析。三者区别如下:
二、二者区别
线性回归分析和logistic回归有什么区别呢?以下从数据类型、前提条件、分析和应用场景四个方面进行说明。
1.数据类型不同
线性回归要求因变量为定量变量而logistic回归要求因变量为分类变量,如果是二元logistic回归分析因变量要求是二分类变量,并且只能为0和1,比如是否购买,1代表是,2代表否,多分类logistic回归分析,因变量要求是分类变量且无序,比如“踢足球”、“打篮球”以及“打羽毛球”等等,有序logistic回归分析因变量要求是分类变量且有序,比如“不愿意”、“愿意”、“非常愿意”等等。
2.前提条件不同
线性回归要求因变量服从正态分布,但是logistic回归没有要求,并且线性回归要求自变量和因变量呈现线性关系,而logistic回归没有要求自变量和因变量呈线性关系。
3.分析关系不同
线性回归是分析整个因变脸与自变量之间的关系,但是logistic回归是分析因变量取某个值的概率与自变量之间的关系。比如二元logistic回归分析,最后分析因变量为1的概率与自变量之间的关系。
4.应用场景不同
线性回归分析和logistic回归分析因变量不同所以导致二者应用也不同,在实际生活中,线性回归一般用于数量统计方法的基础,常常用于对定量数据的预测,比如用于预测房价,logistic回归分析更适合预测分类问题,比如预测某件事情的发生,预测贷款是否违约等等,线性回归一般还可以解决线性问题,logistic回归可以解决非线性问题。
三、二者操作
线性回归分析
操作路径:通用方法→线性回归
Logistic回归分析
操作路径:进阶方法→二元logit/多分类logit/有序logit
四、分析案例
1.线性回归分析
https://zhuanlan.zhihu.com/p/608170831
2.Logistic回归分析
以二元logit回归举例进行说明。
二元logistic回归分析全流程分析 - 知乎 (zhihu.com)
五、总结
本篇文章主要讲述了线性回归和logistic回归,包括二者说明,二者区别,如何操作,以及分析案例四个方面,其中发现二者的数据类型不同、前提条件不同,分析关系不同以及应用场景不同。欢迎补充。
网友评论