美文网首页生物信息学
重要抽样分布:卡方分布(χ2分布)、t分布和F分布

重要抽样分布:卡方分布(χ2分布)、t分布和F分布

作者: LiBiscuit | 来源:发表于2018-10-18 21:03 被阅读345次

    冒泡~:最近在回顾一些以前学过的概率论和数理统计的知识 发现这三个抽样分布经常出现,在参数估计和假设检验也会运用到,所以做一下整理。

    【首先,这三个抽样分布都是来自正态总体的常用的分布 可以根据情况应用于显著性检测】


    1.χ2分布

    定义:

    设 X1,X2,......Xn相互独立, 都服从标准正态分布N(0,1), 则称随机变量χ2=X1²+X2²+......+Xn²所服从的分布为自由度为 n 的χ2分布.

    自由度:所包含的独立变量的个数 (eg:χ2=X1²+X2²  自由度为2)

    图和式子如下:

    关于图像:

    从分布图可以看出:图像分布在第一象限内,卡方值都是正值,呈右偏态,随着参数 n 的增大,分布趋近于正态分布;随着自由度n的增大,向正无穷方向延伸(这是因为均值n越来越大),分布曲线也越来越低(因为方差2n越来越大)。

    更细致观察:

    当n=1或者2时:卡方分布先高后低的平滑曲线,检验统计量等于较小值的概率远远大于较大值的概率,即观察频数有可能接近期望频数。

    当n大于2时:卡方分布先低后高再低,其外形沿着正向扭曲

    一些结论:

    1.χ2分布具有可加性:若χ12~χ2(n),χ22~χ2(m),且二者相互独立,则χ12+χ22~χ2(n+m)

    2.卡方分布的 期望E(χ2)=n,方差D(χ2)=2n。

    应用:(补充ing)

    卡方分布指出观察频数与期望频数之间差异显著性,和其他假设一样,这取决于显著性水平。

     1、显性水平α进行检验(常用的显著性水平0.05)

     2、检测标准:卡方分布检验是单尾检验且是右尾,右尾被作为拒绝域。于是通过查看检验统计量是否位于右尾的拒绝域以内,来判定期望分布得出结果的可能性。

     3、卡方概率表的使用:

    卡方分布假设检验步骤: 总是使用右尾

      1、确定要进行检验的假设(H0)及其备择假设H1.

      2、求出期望E和自由度n.

      3、确定用于做决策的拒绝域(右尾).

      4、计算检验统计量.

      5、查看检验统计量是否在拒绝域内.

      6、做出决策.

    ps:卡方分布检验其实就是假设检验的特殊形式。


    2.t分布

    定义:

    t分布又叫student-t分布,常常用于根据小样本来估计呈正态分布且方差值为知的样本的均值。

    (一个前提是:t分布的样本的总体必须符合正态分布。t分布一般用于小样本(样本量比较小)的情形。)

    假设X服从标准正态分布即X~N(0,1),Y服从自由度n的卡方分布即Y~χ2(n),且X与Y是相互独立的,那么Z=X/sqrt(Y/n)的分布成为自由的为n的t分布,记为Z~t(n).

    期望 E(T)=0,方差 D(T)=n/(n-2),n>2

    图和式子如下:

    图像的特点:

    1.图像整体以0为中心,左右对称的单峰分布;

    2.t分布是一簇曲线,可发现其形态变化与n(即其自由度)大小有关。

    自由度n越小,t分布曲线越低平;自由度n越大,t分布曲线越接近标准正态分布曲线,当自由度无限大时,t分布就成了正态分布

    应用:

    t检验

    1.建立假设、确定检验水准α

    H0:μ = μ0 (零假设null hypothesis)

    H1:μ ≠ μ0(备择假设alternative hypothesis)

    双侧检验,检验水准:α=0.05

    2.计算检验统计量

    3.查相应界值表,确定P值,下结论。

    (ps:t检验适用于两个变量均数间的差异检验)


    3.F分布

    期望E(F)=n/(n-2),方差D(F)=2n^2(m+n-2)/m(n-2)^2(n-4)

    图像:

    F分布为非对称分布  有两个分位点

    应用:方差的同质性检验

    此检验参考资料:数据统计基础之F分布及其应用 - 振裕 - CSDN博客

    方差分析(ANOVA也称为变异数分析和F检验)

    详细可参考:https://wenku.baidu.com/view/bcca13af7c1cfad6195fa779.html


    finally~

    今天也要假装元气满满的鸭!

    相关文章

      网友评论

        本文标题:重要抽样分布:卡方分布(χ2分布)、t分布和F分布

        本文链接:https://www.haomeiwen.com/subject/icwszftx.html