定义 其中
形状,随着自由度提升,越来越接近正太分布。
Chi Square distributions are positively skewed, with the degree of skew decreasing with increasing degrees of freedom. As the degrees of freedom increases, the Chi Square distribution approaches a normal distribution.
推论1 :chi-square其泛化形式为
-
1、对于Binomial分布,为success的次数。
-
2、用Normal Distribution来逼近Binomial
当n很大时,可以用高斯分布逼近:
即 -
3、化为标准正太:
由于:
所以:
得到其平方后服从chi-square distribution: -
4、化为泛化形式:
将,带入:
得到泛化的形式即:
检验1 Observation 与 Expectation 的一致性
构造,如果Observation 服从 Expectation 的分布,则该统计量服从的分布
F分布
定义
推论2:sample variance is proportional to a chi-squared distribution
检验2 两总体的方差一致性
由上述推论2,我们可以用两样本的sample variance构造F statistics
得到:
所以当时,两组方差的分布符合F统计量。
即
t分布
假设
对于变量: 【服从标准正太分布】
对于变量:【服从n-1度的t分布】
检验3 均值差异
在最简单的形式中,Anova(F-test)可以用以比较量2个或多个变量的均值,以此 generalize T-test。当在比较2组的时候,他们是等价的
我们拿个简单的例子,比较与在均值上是否存在差异(均值差异来自变量自身的variance还是组间差别):
当两sample来自同一分布时,以下统计量服从T分布。
PS:这里为了做简单的推导,所以将样本量都设为,其实将带入也是等价的。
Refer: https://www.jianshu.com/p/0daa59e481e3
关联
其实,F检验是T检验的一种泛化
Chi-square,F,T,几种分布,都与Gaussian Distribution有紧密的关联。很多问题都可以用不同的方法来检验。
网友评论