美文网首页
第五章---简单统计推断:总体参数的估计

第五章---简单统计推断:总体参数的估计

作者: 3between7 | 来源:发表于2019-11-18 15:37 被阅读0次
    • 统计推断
      从数据得到关于总体参数的一些结论的过程叫做统计推断

    5.1用估计量估计总体参数

    • 统计量
      样本的(不包含未知总体参数的)函数为统计量,而用于估计的统计量称为估计量

    • 点估计(point estimation)
      点估计,也就是用估计量的实现值来近似相应的总体参数。

    • 区间估计(interval estimation)
      它是包括估计量在内(有时是以估计量为中心)的一个区间,该区间被认为很可能包含总统参数。

    5.2 点估计

    • 无偏估计量

    所谓的无偏性就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。严格说来,如果估计量的数学期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。

    随机样本产生的样本均值、样本标准差和Bernoulli试验的成功比例都是无偏估计。

    • 最小方差无偏估计量
      即方差最小的估计量,作为最小方差无偏估计的描述性例子:

    假定X_1,...,X_n(n >2)为来自一个总体的独立随机样本,这些观测值互相独立,那么,对于总体均值μ的无偏估计就有很多,比如下面的统计量都是无偏估计,他们的期望都是μ

    \bar X = \frac1n \sum_{i=1}^nX_i, (X_1+X_2)/2, \frac 13X_1+\frac23X_2, X_1

    但是,他们的标准差不同,第一个是\sigma/\sqrt n,第二个是\sigma/\sqrt2,第三个是\sqrt{5/9} \sigma,最后一个是\sigma,显然\bar X 的标准差最小。

    5.3 区间估计

    • 置信区间

    举例说明置信区间的概念:

    为了估计某候选人在选民中的支持率(即总体比值p),调查机构的民意测验可能会说,该候选人的“支持率为75%,误差是±3%,置信度是95%”。这种说法意味着下面三点:

    1,样本中的支持率为75%,这是用样本比例作为对总体比例的点估计。
    2,估计范围为75%±3%,即区间估计。
    3,如果用类似的方式,重复抽取大量(样本量相同的)样本时,产生的大量类似区间中会有些覆盖真正的p,而有些不会,但这些区间中大约有95%会覆盖真正的总体比例。

    这样得到的区间被称为总体比例p的置信度为95%的置信区间。置信度、样本量与区间之间的关系:
    1,样本量相同时,置信度的增加导致区间变长;
    2,置信度相同时,样本量的增加导致区间变短。

    • 关于置信区间的注意点

    不要认为由一个样本数据得到的总体参数的一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。置信度95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。

    相关文章

      网友评论

          本文标题:第五章---简单统计推断:总体参数的估计

          本文链接:https://www.haomeiwen.com/subject/vuavictx.html