01
为什么要引用对应分析?
在进行数据分析时我们经常遇到分类型数据,然而我们在研究两个或两个以上的分类变量(什么是分类变量?比如:性别分为“男”“女”故性别就是一个简单的分类变量)i的关系时平常我们所使用的分析方法就力不从心了,由此对应分析的学习就显得很有必要了。
02
什么是对应分析?
通过分析“分析变量”所构成的“列联表”来揭示变量之间的关系,可用对应分析图显示列联表中的每一个单元格的相对位置以简单直观的方式来表明各个变量之间的关联,简言之对应分析就是将分类变量构成的列联表中的数据信息呈现在一张散点图上,我们通过对散点图的解读来了解分类变量之间的关联。
03
对应分析的简介
对应分析分为简单对应分析(2个变量)以及多元对应分析(3个及以上的变量)
简单对应分析:成绩与是否课外补习班之间的对应关系
多元对应分析:成绩与课外补习班以及学生的学习的有效时间之间的对应分析。
怎样的情况下可以用对应分析?也就是说对应分析的使用条件是什么?
大致有以下两种条件:其一即卡方检验结论有统计学意义的时,对应分析才会在变量各类别之间找到明显的类别关系。(即P值≦0.05时,分类变量间有显著性关联);其二就是样本量不可太小(具体大小参照卡方检验的要求,但不应小于40个)。
04
对应分析的具体操作和结果解读
“分析”---“降维”---“对应分析”
结果解读 :
注:从该“速度”和“过人”交叉表中能够看出对应的数值大小,却并不能看出其互相关系!!!
补充:若还有行点和列点的正态化对比图的话,其中行点和列点距离越近,关系越密切(图表分析)
(图片来源于网络)
文| DLZ
网友评论