美文网首页
R可视化处理常用的概率函数图——连续型

R可视化处理常用的概率函数图——连续型

作者: 文思汇集 | 来源:发表于2018-12-27 21:06 被阅读0次

对于连续型连续型的随机变量的分布,我们叫做密度函数;

①正态分布


正态分布:norm(\mu \sigma ^2),它是一种连续型分布;

正态分布是根据中心极限定理的推理而得来,即一个变量如果有大量微小、独立的随机因素叠加的结果,那么这一个变量一定是正态分布;而且一个变量不管它服从什么样的分布,它的样本和的均值一定服从正态分布。正态分布的期望为:\mu ,方差为:\sigma ^2,

假如,我们将三个方差不同的正态分布放在一个图上进行比较;如下:

R编码 正态分布函数图

②T分布


T分布:t(n),它是连续型分布;

T分布的描述:随机变量X和Y,其中X服从标准正态分布,Y服从自由度为n的卡方分布,则         T=X/\sqrt{Y/n} 就服从自由度为n 的T分布。

关于T分布的实际意义:在样本均值的显著性检验中,根据中心极限定理,我们认为一个样本量足够大的随机抽样,不管其服从什么分布,但其样本均值的抽样分布近似的服从正态分布。不同的样本就会产生不同的总体均值的估计;为了研究样本均值对总体均值的准确程度,我们就有了样本均值的标准差,样本均值的标准差我们叫做标准误(\sigma (hat)=\sigma /\sqrt{n} )。由于总体的标准差是未知的,因此我们就用了样本的标准差(s)来代替来总体的标准差(\sigma ),因此就有了估计标准误se=s/\sqrt{n} ;j进而,我们就有了检验统计量T;t=(\bar{x}-\mu 0)/s\sqrt{n}

因此,我们可以得出其T统计量就是检验样本均值的离散程度的统计量。其中,自由度n就是样本的容量。

假如:我们现在用R做一个不同自由的t统计的密度函数图,如下:

R编码 T统计与标准正态分布图

x^2 分布


卡方分布:chisq(n),它是一种连续型分布;

n个独立的正态随机变量的平方和就服从自由度为n的卡方分布;卡方分布的期望为n;标准差为2n;

假如:我们通过R画一组不同自由度的卡方分布进行对比图来看,如下:

R编程 卡方分布图

④F分布


F分布:f(n,m),F分布是一种连续型分布;

随机变量X和Y相互独立,其中X服从自由度为n的卡方分布,Y服从自由度为m的卡方分布;则             T=(X/n)/(Y/m)服从自由度为(n,m)的F分布;

假如:我们用R画出一组自由度不同的F分布图进行对比,如下:

R编码 F分布函数图

相关文章

网友评论

      本文标题:R可视化处理常用的概率函数图——连续型

      本文链接:https://www.haomeiwen.com/subject/ceqdlqtx.html