一:回归的类型
简单线性:用一个量化的解释变量预测一个量化的相应变量
多项式:用一个来量化的解释变量预测一个量化的相应变量,模型的关系是n阶多项式
多层:用拥有等级结构的数据预测一个响应变量(例如学校中教室里的学生)。也被称为分层模型,嵌套模型或混合模型
多元线性:用两个或多个量化的解释变量预测一个量化的 响应变量
多变量:用一个或多个解释变量预测多个相应变量
Logistic:用一个或多个解释变量预测一个类别型响应变量
泊松:用一个或多个解释变量预测一个代表频率的响应变量
Cox比例风险:用一个或多个解释变量预测一个时间发生的时间
时间序列:对误差项相关的时间序列数据建模
非线性:用一个或多个解释变量预测一个类别型响应变量,不过模型是非线性的
非参数:用一个或多个解释变量预测一个类别型响应变量,模型的形式源数据形式,不事先设定
稳健:用一个或多个解释变量预测一个类别型响应变量,能抵御强影响点的干扰
二:OLS回归
OLS回归是通过预测变量的加权和来预测量化的因变量,其中权重是通过数据估计而得以的参数。使残差平方和最小
为能够恰当地解释OLS模型的系数,数据必须满足以下统计假设:
(1)正态性对于固定的自变量,因变量值成正态分布
(2)独立性 Yi值之间相互独立
(3)线性 因变量与自变量之间为线性相关
(4)同方差性因变量的方差不随自变量的水平不同而变化,即不变方差或同方差性
三: 用lm()拟合回归模型
拟合线性模型最基本的函数就是lm(),格式为:
myfit<-lm(formula,data)
formula指要拟合的模型形式,data是一个数据框,包含了用于拟合模型的数据
formula形式如下:Y~X1+X2+……+Xk (~左边为响应变量,右边为各个预测变量,预测变量之间用+符号分隔)
以上为r语言回归的基本理论,下篇文章,为大家提供实战的“简单新型回归”“多项式回归”有疑问欢迎留言~~
网友评论