美文网首页概率论
统计学的置信区间

统计学的置信区间

作者: 龍猫君 | 来源:发表于2018-07-20 23:37 被阅读0次

有时候无法给出足够正确的结果。我们使用的是样本,没有使用整个总体,只是得到最佳的点估计量,存在着小心的误差。不使用精确值作为总体均值的估计值,但是我们可以指出某个区间来估计。

一、置信区间简介

置信区间展现的是,这个总体参数的真实值有一定概率落在与该测量结果有关的某对应区间。置信区间给出的是,声称总体参数的真实值在测量值的区间所具有的可信程度,这个概率被称为置信水平。置信水平越高,所对应的置信区间就会越大。

让均值的点估计计量处于这个区间的中央,并且在整个区间的上下限设定为这个点估计量加上或者减去某个误差。

由于a和b的确切数值取决于希望自己对于该区间包含总体均值,这一结果具有可信程度,所以[a,b]称为置信区间(误差范围)。置信区间又称估计区间,是用来估计参数的取值范围的。

求解置信区间主要步骤

第1步:选择总体统计量(要解决的实际问题)

第2步:求出统计量的抽样分布(样本的平均值和标准误差)

第3步:求出置信区间

第4步:求出置信区间的上下限的值

二、大样本求解置信区间

当大样本大小大于30, 抽样分布符合中心极限定理描述的正态分布

1步:选择总体统计量(要解决的实际问题)

例如人口普通:调查全国男性平均身高,不可能把每个人的数据统计到,只能通过样本的数据来统计估计总体的数据。

2步:求出统计量的抽样分布(样本的平均值和标准误差)

当样本数据大小大于30时,是符合中心极限定理,即符合正态分布。

假设我们抽样的样本大小是100人,样本平均值是167.1cm,样本的标准差是0.2cm。

求得标准误差是0.02cm

3步:求出置信区间

确定置信区间水平 常用的置信水平是95%

4步:求出置信区间的上下限的值

a=总体平均值- 几个标准误差

 =总体平均值–z*标准误差

由于符合正态分布,所以我们可以使用正态分布求置信区间

算出标准分,查询标准正态分布概率表,求得需要的结果。

查z表求得标准分z=-1.96

下面可以求得a和b

a=样本平均值- 几个标准误差

 =样本平均值–1.96*标准误差

=167.1-1.96*0.02

=167.0608

b =样本平均值+ z*个标准误差

  =167.1+1.96*0.02

  =167.1392

在置信水平95%,得到置信区间为[167.0608, 167.1392]

其中z的数值取决于所需要的置信水平,只要以正态分布作为试验基础,就可以使用这些数值来计算。

三、样本大小小于30的置信区间

当样本很小时(样本大小小于30),抽样分布符合t分布

T分布介绍

当样本很小时候,曲线较为扁平,有两条粗粗的尾巴,只有一个参数v,v=n-1, n为样本的大学,v称为自由度

自由度是指在不影响给定限制条件的情况下,可以自由变换信息的数量。 可以将自由度看做估算其他信息时可有的独立信息数量。

符合t分布的置信区间的求解过程:

1.选择总体统计量(确定要求解的问题)

例如想知道某新药物A的对神经的反应时间

2.求样本的平均值和标准误差

其中抽样大小为10,注射药物A平均反应时间为1.05秒,样本标准差为0.5秒

计算标准误差为0.158

求得自由度为v=10-1=9

3.查找t表格求着t的值


求得t的值为2.262

4.求置信区间的上下限的值

下面可以分布求得a和b

a=样本平均值–t*标准误差

=1.05-2.262*0.158

=0.692

b =样本平均值+ t*个标准误差

  =1.05+2.262*0.158

  =1.407

在置信水平95%,得到置信区间为[0.692, 1.407]

当大样本大小大于30, 抽样分布符合中心极限定理描述的正态分布

当样本很小时(样本大小小于30),抽样分布符合t分布

相关文章

  • 回归分析的前提假设

    置信区间 是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence i...

  • 讲讲Bootstrap是在干啥?

    学过统计学的同学应该对置信区间都有了解,置信区间又叫估计区间,是从概率来讲某个随机变量可能取的值的范围。 那很多...

  • 2019.3.16 错过的计算题-应用统计学

    1统计学 对于正态分布,这个关系很重要! (x-u)/ 参数估计类的题目: 无偏估计量: 置信区间 假设类的题目:...

  • 统计学的置信区间

    有时候无法给出足够正确的结果。我们使用的是样本,没有使用整个总体,只是得到最佳的点估计量,存在着小心的误差。不使用...

  • 用R语言计算统计学习题(下)

    上集:用R语言计算统计学习题(上) 第8章 置信区间估计 8.25,电话公司调查安装费用,随机选取了500个家庭用...

  • Stage 1 数学基础:统计学思考方法

    如果你已经掌握了P值,置信区间,回归模型,那么你已经得到了统计学的主干.而基于这个主干之上的枝叶,同样非常重要,如...

  • 回归分析基本假设

    置信区间 置信区间是随机变量 置信水平:95%置信区间,从总体中对样本进行随机采样,计算参数的置信区间,那么100...

  • 百分之五

    统计学检验里有一个95%置信区间的说法,许多生理数值的参考值也是采用的95%作为参考,也就是说,正常人的生理数值有...

  • 1210学习总结--很多还没学加快进度

    统计学还没有看完。正在学习总体和样本。下一步置信区间。 周六收集完抱团学习同学的计划表。凯旋让我分析这份数据,也是...

  • 数据探索之假设检验

    推断统计学一般有两种方法,一是使用置信区间估算总体的参数,二是对总体参数的假设值进行决策。后者被称为假设检验,是我...

网友评论

    本文标题:统计学的置信区间

    本文链接:https://www.haomeiwen.com/subject/dcywhxtx.html