5种常见的相关分析方法
第一、散点图和折线图
第二、相关系数
第三、当数据类型是特征值(离散)时用互信息方法求相关性
excel回归分析的参数解读
一元线性回归中
1、回归统计中:
- A、Multiple R:x和y的相关系数r,一般在-1~1之间,绝对值越靠近1则相关性越强,越靠近0则相关性越弱;
- B、R square:x和y的相关系数r的平方,表达自变量x解释因变量y变差的程度,以测定量y的拟合效果;
- C、Adjusted R Square:调整后的R square,说明自变量能说明因变量百分比,和B的区别在于,通常一元回归的时候看B项多,而多元回归时候看C项多;
- D、标准误差:用来衡量拟合程度的大小,也用于计算与回归相关的其它统计量,此值越小,说明拟合程度越好;E、观察值:用于训练回归方程的样本数据有多少个;
2、方差分析中 主要作用是通过F检验来判定回归模型的回归效果
- A、主要关注回归分析这一行的Significance F(F显著性统计量)的P值,以统计常用的0.05显著水平为例,这里的2E-12明显小于P=0.05,则F检验通过,整体回归方程显著有效;
3、回归参数表
- A、Coefficients(回归系数):intercept对应截距项,x变量-净销售收入的系数;
- B、标准误差:误差值越小,表明参数的精确度越高。不常使用,原因在于:其统计信息已经包含在后述的t检验中;
- C、t stat:T检验中统计量t值,用于对模型参数的检验,需要查表才能决定。t值是回归系数与其标准误差的比值。经常一元回归可以看F检验或者回归统计基本能支撑判断,但对于多元线性回归,t检验就不可缺省了;
- D、P-value:T检验对应的P值,当P<0.05时,可以认为模型在α=0.05的水平上显著,或者置信度达到95%;当P<0.01时,可以认为模型在α=0.01的水平上显著,或者置信度达到99%;E、Lower 95% /Upper 95% /下限 95.0% /上限 95.0% : 95%置信区间的上下限值。
一元回归中 看回归统计或者看F检验看Significance F(F显著性统计量)的P值,如果小于0.05那就有95%的置信度
多元回归中除了F检验外还要看T检验
- 因变量为连续变量,自变量至少有一个连续变量,进行多元线性回归
- 因变量为连续变量,自变量全部为分类变量,进行方差分析
- 因变量为分类变量,自变量至少有一个连续变量,使用logit模型(逻辑回归 进行log转换)
- 因变量为分类变量,自变量全部为分类变量,进行交叉分析和卡方检验
分析方法有
- 相关性分析(是否显著确实相关 一元回归要经过F检验,多元回归要经过 F、T检验——方差分析用F检验)
- 回归分析法(经过检验显著后,建立回归模型)
- 聚类分析法
- 判别分析法
- 主成分分析法
- 因子分析法
- 对应分析法
- 时间序列
网友评论