似然(likelihood):过去的可能性。
最大似然估计(maximum likelihood estimation):是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。
“现实的就是合理的,合理的就是现实的”。——黑格尔
最大似然估计的步骤
最大似然估计可以分为八步。跟显著度检验相似,每一步都要看清楚,否则就会“迷路”的。
第一步,放弃研究假设,设立零假设,假定自变项与因变项之间在总体系统中无关。设立“零假设”使用反证法,为了放弃它。
第二步,以零假设为基础,算出样本统计值出现的似然性(概率值),取似然性的自然对数,再乘以-2。绕个弯子的理由是得出来怪数(似然性自然对数的负2倍,-2ln likehood),这个数的分布与卡方值的分布相似,可以当卡方值的代用品。
第三步,以上述得到似然性自然对数的负2倍为指标,查卡方值,得出假设是否成立的概率。概率P<0.05(0.001)便放弃零假设。注意,这里又一个新的零假设,是关于模型与数据的契合度(goodness-of-fit,拟合优度)的。这个零假设是:作为一个模型,初始估计与数据天衣无缝,完美锲合,零误差。
第四步,如果不能放弃关于初始模型的零假设(即,自变项与因变项无关)则研究无疾而终。
第五步,如果有信心放弃关于初始模型的零假设,研究继续进行,提出替代假设。
第六步,提出替代假设的依据是把初始模型预测结果与样本中观察到的情况(统计值)进行对比,即比较交叉表中预期值与观察值。预期值大于观察值,就把回归系数从0调至负数;预期值小于观察值就把回归系数由0调到正数。
第七步,以似然性自然对数的负二倍为指标,决定替代模型是否比初始模型更符合数据。看看记录最大似然估计过程的估计记录(iteration history迭代史),迭代模型指标一定小于初始模型指标。
第八步,不断修正替代模型,即不断增大回归系数绝对值,直到模型与数据的契合度不再“显著”改进。
至此,最大似然估计大功告成。
网友评论