对于连续型连续型的随机变量的分布,我们叫做密度函数;
①正态分布
正态分布:norm(,^2),它是一种连续型分布;
正态分布是根据中心极限定理的推理而得来,即一个变量如果有大量微小、独立的随机因素叠加的结果,那么这一个变量一定是正态分布;而且一个变量不管它服从什么样的分布,它的样本和的均值一定服从正态分布。正态分布的期望为:,方差为:^2,
假如,我们将三个方差不同的正态分布放在一个图上进行比较;如下:
R编码 正态分布函数图②T分布
T分布:t(n),它是连续型分布;
T分布的描述:随机变量X和Y,其中X服从标准正态分布,Y服从自由度为n的卡方分布,则 T=X/就服从自由度为n 的T分布。
关于T分布的实际意义:在样本均值的显著性检验中,根据中心极限定理,我们认为一个样本量足够大的随机抽样,不管其服从什么分布,但其样本均值的抽样分布近似的服从正态分布。不同的样本就会产生不同的总体均值的估计;为了研究样本均值对总体均值的准确程度,我们就有了样本均值的标准差,样本均值的标准差我们叫做标准误((hat)=/)。由于总体的标准差是未知的,因此我们就用了样本的标准差(s)来代替来总体的标准差(),因此就有了估计标准误se=s/;j进而,我们就有了检验统计量T;t=(-0)/s。
因此,我们可以得出其T统计量就是检验样本均值的离散程度的统计量。其中,自由度n就是样本的容量。
假如:我们现在用R做一个不同自由的t统计的密度函数图,如下:
R编码 T统计与标准正态分布图③分布
卡方分布:chisq(n),它是一种连续型分布;
n个独立的正态随机变量的平方和就服从自由度为n的卡方分布;卡方分布的期望为n;标准差为2n;
假如:我们通过R画一组不同自由度的卡方分布进行对比图来看,如下:
R编程 卡方分布图④F分布
F分布:f(n,m),F分布是一种连续型分布;
随机变量X和Y相互独立,其中X服从自由度为n的卡方分布,Y服从自由度为m的卡方分布;则 T=(X/n)/(Y/m)服从自由度为(n,m)的F分布;
假如:我们用R画出一组自由度不同的F分布图进行对比,如下:
R编码 F分布函数图
网友评论