视频结构方程模型基本介绍的笔记
sem
structural equation modeling,基于变量之间协方差矩阵分析变量之间关系的方法。
路径分析(多个自变量对多个因变量的影响)和测量关系(潜变量)
优势
- 潜变量的处理(如动机,态度等)
- CFA分析以计算效度
- 高效快速揭示自变量和因变量间的复杂关系。
变量
三种变量- 潜在变量:latent variable
- 显性变量(测量变量):manifest(显示) variable,observed v,indicator v
- 残差变量无法解释的变异量
两类模型
- 测量模型:由潜变量和观测变量构成
- 结构模型:潜变量间因果关系的模型
- ξ:内在潜在变量
-
η:外因潜在变量
两种模型
方差估计与假设检验
操作
-
plugins-draw covariance 可以画出所有的变量之间的cov
-
双箭头上标的数字即cov
-
假定两个变量的协方差相同,则需要将二者的"variance"调整为同一个参数(如都设置成(cov_x1)。
-
view-interface properties-orientation(页面朝向)-landscape
结果
analysis summary
- estimate:cov 估算值
- SE:standard error
- CR:对H0:cov≠0的检验
- p:significance
notes for model
- number of distinct(显著的)moments sample :显著的样本矩
样本矩:常用的表示样本的数字特征的统计量。
一阶矩:样本期望
二阶矩:二阶中心矩,变量和均值的差的平方求期望,即方差
样本矩
-
number of distinct parameters to be estimated:要估计的参数个数,即参与方差估计的参数个数。
-
df:上二者相减
-
chi-square:H0为样本cov=假定cov,p不显著则表示二者存在差异。
chi-square=\cmin(\df degree of freedom) p=\p:显示在输出路径图中。
线性回归
视频人大论坛公开课sem结构方程模型笔记
例子:userguide.xls表中warren5v表
- performance:24道关于计划,组织,协调能力的测试得分
- knowledge:26道关于产品知识题目得分
- value:30道经济评价得分
- satisfaction:11道满足感测试得分
用剩余三项预测performance
自由度为0的是恰好可识别模型/饱和模型
递归模型recursive model:没有反馈回路的模型为递归模型,即内生变量之间因果关系为单方向,一个变量不能是起因同时又是效应
标准化路径图中因变量/内生变量方框的数字为判定系数
判定系数=0.40信度评估
warren9v.wkl表,分半信度。
将外生变量(没有被箭头指到的)和内生变量作为潜变量,分开的两半分别作为显变量的潜变量
分半信度
模型修正
- 模型A(弱模型):原分半信度模型
- 模型B(强模型):
- performance、knowledge和value的两个测验为平行测验,回归系数假定相等
- satisfaction的两个分测验的回归系数相差1.2倍,两测验的error之间差1.2^0.5倍
若模型B正确,ChisqB-ChisqA ~chisquare(dfB-dfA),两模型卡方值的差服从df=dfB-dfA的卡方分布。
若模型A正确,B错误,那么ChisqB-ChisqA是较大的值,ChisqB-ChisqA>Chisq(df=dfB-dfA,α=0.05),p(ChisqB-ChisqA)<0.05
探索性分析
对不同时点的潜变量建模
修正指数和CR系数的使用
对多个模型进行比较
解释结果,直接效应,简介效应,因子得分 []√
例子:wheaton.sav,1966和1971年932人的跟踪报告
- anomia67:67年失语症得分
- anomia77:
- powles67: 67年无助感得分
- powles77
- education:66年的受教育年限
- SEI:66年社会经济指数
- 潜变量ses(social economic status):education&sei
- 潜变量alienation(孤独感):powerless&anomia
修正指数(Modification Indices):
view-analysis properties-output-modification indices,threshold:小于该值的修正指数将被忽略
MI值为修正后卡方下降的值。从最大的修正指数开始修订。修正时要注意逻辑与常识。
CR系数(critical ratios for differences)
MI通过增加参数减少自由度,降低卡方值。
CR值通过增加约束,自由度可增加。
view-analysis properties-output-critical ratios for differences,CR<1.96都可以考虑。先考虑最小的CR值。
同时验证多个模型:
- 点击左侧红色圆圈,在对话框中点击new即可。
-
可以在parameter constrains中设置参数的取值,如var_a67=0,其中cov_a67是67年anomia的方差,在绘图时命名为"var_a67"即可。
多个模型
多个模型的比较
- model fit,看p值,p值大的较优。
直接,间接,总效应
- analysis->indirect,direct,total effect
- output 中的estimate,
- 符号是相关方向,列是因变量,影响取决于行变量
非递归模型
- 非递归模型unrecursive model:有反馈回路的模型,变量是起因同时又是效应。
- 两个变量可能互相影响。回归系数影响能否形成稳定的线性依赖关系。
- 稳定系数(stability index for the following variables):(-1,1)区间内稳定。在output中的notes for group/modle中查看
- 稳定系数不在区间内,a、模型错误;b、样本量过少
- 一个回路计算一个稳定系数,多个回路中有一个超过稳定区间,那么回路就是不稳定的
CFA
model fit
- 公共因子载荷,因子和可测变量之间的系数
- 信度:各可测变量的判定系数即测验的信度(前提是误差项只代表测量误差)
根据ctt模型,信度=真分数和实得分数相关系数的平方。rxx=ρTX2。
- ρTX2即判定系数R2,因此判定系数即测验的信度
多组模型:对多组模型建模
- /group:显示组名,用于区分两组
- /format:标明standardized/unstandardized estimate
检验两组系数差异是否显著
- object properties->parameters,输入相同的字母来代表参数相同。->点击对话框右下角的"all groups"
均值结构模型
均值:对应外生变量
截距项:对应内生变量
缺失值
传统做法
- listwise deletion:列表删除法,删除该个体数据
- 单点法pointwise,
- 匹配法pairwise:比如计算相关系数,将所有的完整的数据都代入运算,即使有些数据的其他变量存在缺失。但是可能产生非正定的协方差矩阵
- data imputation补充缺失值:均值插补;回归插补,只在MCAR(miss completely at random即完全随机缺失)时有效
amos默认使用最大似然法
- 适用于MCAR&MAR两种机制,不适用与NMAR
- 回归插补(确定插补,后两种是不确定插补) y=a+bx
- 随机回归插补 y=a+bx+epsilon(随机变量)
- 贝叶斯回归插补
- 多重插补:实施多次不确定插补
- 基于模型的插补,基于一个模型进行插补
默认插补
- 存在缺失时必须选上"estimate means and intercepts"(在view->analysis propertites中)
-
否则:
产生提示
贝叶斯回归插补
- 执行插补,创建m个完整数据集
- 分析每个数据集
- 合并m个分析结果
- analyze->data imputation->bayesian imputation 5-10个就够了->选择multiple output files
- 合并后的参数估计值Qbar=E(Q),对每次的结果简单平均
- 合并之后的标准误:
√U(t):第t个样本参数估计的标准误
合并之后的标准误
参数
模型匹配指标模型匹配指标
- 绝对指标 样本共变异数矩阵被模型解释的比例,类似R2
- chi-square=\cmin
- df=\df
- chi/df=\cmindf
- GFI(goodness of fit index拟合优度指数) >0.9
- AGFI(adjusted goodness of fit index修正你和优度指数) >0.9
如果结果中没有GFI和AGFI,可能是勾选了estimate means and intercepts。取消勾选即可。
- RMR(root mean square error of approximation残差均方根) <0.05
- RMSEA((root mean square error of approximation近似误差均方根) <0.05
-
相对指标研究模型的适配度和基本模型(虚无模型)相比的改善程度
- NFI(normal fit index规范拟合指数)>0.9
- NNFI(non-normal fit index非规范拟合指数;TLI,tucker-lewis index)>0.9
- IFI(incremental fit index增殖拟合指数)>0.9
- CFI(comparative fit index比较拟合指数)>0.9
-
信息指标(用于竞争模型)
- AIC(akaike information criterion赤池信息准则)越小越好
- ECVI(cross validation index交叉验证指数)越小越好
-
NCP:用于竞争模型,两个模型之间比较
-
HOLTER:在该置信水平下,大于200表示样本充足
基本假设:模型共变异数矩阵=样本共变异数矩阵
潜变量和它的测量变量之间必有有一个路径系数为1作为参考。
残差对测量变量的路径系数默认为1
修正
因子载荷量(潜变量和显变量箭头上的数字)<0.6
SMC<0.36(squared multiple correlation,决多重定系数,方框旁边的数字),0.36是0.6的平方
残差相关(提高适配度)
-
残差之间的MI系数
-
sem的前提:残差之间相互独立。因此一般删除相关的两变量之一,具体删除那个看那个变量总体来说的MI最大。
-
题目之间的MI系数一般不采用,因为题目之间默认不相关。
-
恰好辨识:一个潜变量只有三个观察变量时,无匹配度参数,此时只看因子载荷量即可。
路径分析
非标准化系数
- 需要先通过违反估计(offending estimates),以判断估计系数是否超出可接受范围
- 误差项的估计系数不能为负
- 非标准化因子负荷量&结构路径系数是否显著(标准化系数无显著性)
标准化系数
- 0~1之间
- 标准化因子载荷量>0.6(0.7以上理想,探索性问卷0.5即可)
- 不可过度接近1(原则上<0.95)
- 测量模型(潜变量之间)SMC>0.36,不超过0.9(0.9的平方)
- 结构模型(每个潜变量与其显变量)SMC:0.19较小,0.33中等,0.67较大
收敛效度(composite reilability,CR)
- 构面内部一致性,相当于cronbach"s alpha,
- CR大于0.7可以接受
CR
lambda:标准化因子载荷
epsilon:标准化残差
- AVE(average of variance extracted,平均变异萃取量)。潜在变量对观察变量的平均解释能力。
-
0.5,0.36~0.5为接受门槛
AVE
区分效度
- 维度之间是否有差别
- 用维度内部相关性(sqrt(AVE),即AVE开方,)和维度之间的相关性的差异。
- 维度内的相关性大于维度外的相关性即可。
网友评论