bootstrap
由Efron于1985年提出,用于估计"参数估计抽样分布"的一种多功能方法,
假设
- 观测值相互独立
- 观测变量满足多元正态分布(多数因子分析和SEM的标准分布假设)
- 如上二者不能满足,在样本足够大时也可以得到近似结果
优势
- 估计参数的标准误
- amos不提供计算R2等统计量的标准误,已有统计量的标准误的正确与否建立在模型假定得到满足且模型正确的前提上
- 拨靴法提供任何一个估计量的近似方差估计,即使模型假定没有满足
- 多个备选模型中的择优问题
- 有多个备选模型时,基于母样本(原数据)和子样本(拨靴得到的数据)所得到的结果之间的差异进行计算,并将差异取平均。
- 选择平均差异最小的模型最为最佳模型。
缺点
- 需要产生大量样本,大量计算,耗时
操作
- view->analysis properties->bootstrap 勾选perform bootstrap,数量
- 在random中设置种子
- numerical选项卡中设置迭代次数为50
结果
参数标准误
- SE:bootstrap 估计的标准误
- SE-SE:bootstrap出来的SE的SE
- MEAN:多次拨靴得到参数的均值
- bias:mean列和常规方法(极大似然估计)结果的偏差,正值高于常规法
- SE-bias:bias列的SE
多模型择优
- mean discrepancy:平均差异,越小说明模型越优秀
- BCC:越小越好
- AIC:越小越好
- CAIC:越好越好
备择方法
- asymptotically distribution_free(ADF):渐进自由分布
- maximum likelyhood(ML):最大似然
- generalized least squares(GLS):广义最小二乘法
ordinary least square(OLS):普通最小二乘法
- unweighted least squares(ULS):未加权最小二乘法
操作:random选项卡中设置随机种子,4种方法都为10(一样的即可);在estimation选项卡中分别选择几种方法后各自运行一次。
基于指定搜索方法选择最优模型
- 验证性的:模型基本确定,少数箭头不确定
- 探索性的:模型不确定,大部分箭头不确定。
验证性的
- 将少数几个箭头设定为可有可无
- analysis->specificaiton search(指定搜索)->在弹出对话框中决定哪些箭头是可有可无的()
- 对话框中的虚线表示可有可无,被选箭头;实线是必须有
- 在"view->interface properties-> accessibility"中勾选"alternative to color"将箭头变成虚线,表示可有可无。
操作
- 在specification search对话框中选择options(方框和对勾),在next search中可以看到共需要拟合多少模型
- "retain only the best___models"表示不同参数下最多搜索的模型数,设置成0表示没有限制,一般限制为10
结果:
- params表示参数个数(箭头个数);C表示卡方似然比度量的差异度
- 双击显示出模型的样子;对话框中间的"γ"按钮可以显示参数
- 根据BCC判断模型的优劣。点击第一列名称可由大到小排列
BCC:0-2没有证据表明不是最优模型;
2-4:不是最优模型证据不明显
4-7:有证据表明不是最优模型
7-10:有很强的证据
大于10:证据明显
- akaike权重:option->current result->BCC,AIC,BIC->akaike weight/bayes factors max/池绳权重/贝叶斯因子。BCC变成BCCL,即表示成为最优模型的概率是多少。
- 选择"akaike weight/bayes factors sum",BCC变成BCCp,即加总为1
BIC准则
0-2:不是最优模型的可能性很小
2-6:有证据表明不是最优模型
6-10:证据较强
大于10,证据强烈
-
show short list:不同估计参数个数的模型的各项指标
-
点击show graph,纵坐标为该参数个数下平均的差异度。拟合程度和模型复杂性的散点图,左下角有指标,NFI1在0.9为临界水平
探索性的
- 只假定哪些是内生变量。
操作
-同上,按住左键拖动鼠标,凡鼠标碰到的箭头都变成可有可无。
启发式指定搜索
- 算法式搜索在可选路径系数增加时不可用。
- 三种策略
- 向前法,
- 向后法,
-
逐步法
三种策略
- 可能无法找到最优模型
操作
选项option中,next search选择stepwise/forward/backward
自动搜索的模型拟合
analysis->multiple-group analysis
打对勾的表示该参数相同
贝叶斯估计
- 频率估计(极大似然估计,假设检验等):总体参数固定,只是未知。具有随机性
- 贝叶斯估计:将所有量都视为随机变量且具有一个概率分布;模型参数未知且随机,存在一个联合概率分布(先验分布),得到样本数据之后根据样本数据信息对先验分布进行修正得到后验分布。基于边际后验分布得到后验分布的均值,标准差,置信区间等
扩散先验分布:希望将先验分布的影响降到最低,取决于样本数据。
amos默认将参数先验分布设为-3.4×10-38,上限为3.4×1038的均匀分布。
操作
analysis->bayesian estimation(ctrl+b快捷键)
菜单栏中第二行红色哭脸变成黄色笑脸后代表收敛达到理想。
样本量足够大时先验分布的影响较小,样本不够时先验分布具有较大的影响。
错误估计
-
模型设定
-
样本量太小:贝叶斯估计可以解决样本太小带来的错误
调整:如果出现不合理值,在bayesian analysis->view->prior(先验)中将不合理值的上下限进行更改。
自动更正:view->option->prior->admissibility test可容性试验勾选上
对模型参数外其他统计量的估计
这些统计量是模型参数的函数,比如直接效应和简介效应。
普通方法:output中estimates->matrices最后一个表standardizeddirect effect和表standardized indirect effects中查看直接变量间接标量
贝叶斯方法:view->additional estimands->选择standardizeddirect effect和standardized indirect effects
自定义一个参数的估计:先对路径系数命名,custom estimands中编写VB函数
- TODO部分进行编写
- 第一个TODO写明函数名字,这里分别新建直接效应、简介效应,二者差值三个变量。
newestimand("direct")
newestimand("indirect")
newestimand("dfference")
- 第二个TODO部分编写函数
newestimand("direct").value=sem.ParameterValve("c")
'sem.ParameterValve("c") 可以在贝叶斯输出结果中直接拖动到等号后边
newestimand("indirect").value=sem.ParameterValve(a") * sem.ParameterValve(a")
newestimand("difference").value=estimand("direct") - estimand("indirect")
删失数据
如果数据缺失,可以根据贝叶斯预算出来。
后验分布
posterior predictive中可以预测每一缺失值的情况。
插补
analysis->data imputation
含有非数值型数据则不能通过回归插补
- 使用饱和模型进行插补
类别数据
数据转换/重新编码
打开数据时勾选"allow non-numeric data"
勾选"非数值数据"
tool->data recall->details中对顺序数据进行排序,其中"<---->"符号代表分界,删除分割线可以将多个选合并为一类,对边界可以设置数值。
采用贝叶斯数据
含有非数值数据时传统方法不再适用
混合模型
- 模型对总体数据错误或不适合,但是将总体分组后,对于每组数据模型是正确的拟合的。
操作
有训练数据时
view->manage group建立分组
在data file对话框的grouping variable中选择数据中的分组,并点击右下角assign cases to group。
混合模型中只能使用贝叶斯计算
无训练数据:建立分组后并不要点击assign cases to group。
提高精度:
减少估计参数个数
将不同组斜率和误差方差设为相同
网友评论