- 统计推断
从数据得到关于总体参数的一些结论的过程叫做统计推断
5.1用估计量估计总体参数
-
统计量
样本的(不包含未知总体参数的)函数为统计量,而用于估计的统计量称为估计量。 -
点估计(point estimation)
点估计,也就是用估计量的实现值来近似相应的总体参数。 -
区间估计(interval estimation)
它是包括估计量在内(有时是以估计量为中心)的一个区间,该区间被认为很可能包含总统参数。
5.2 点估计
- 无偏估计量
所谓的无偏性就是:虽然每个样本产生的估计量的取值不一定等于参数,但当抽取大量样本时,那些样本产生的估计量的均值会接近真正要估计的假定分布的参数。严格说来,如果估计量的数学期望等于欲估计的总体参数,则该估计量称为该参数的无偏估计量。
随机样本产生的样本均值、样本标准差和Bernoulli试验的成功比例都是无偏估计。
- 最小方差无偏估计量
即方差最小的估计量,作为最小方差无偏估计的描述性例子:
假定(n >2)为来自一个总体的独立随机样本,这些观测值互相独立,那么,对于总体均值的无偏估计就有很多,比如下面的统计量都是无偏估计,他们的期望都是。
但是,他们的标准差不同,第一个是,第二个是,第三个是,最后一个是,显然 的标准差最小。
5.3 区间估计
- 置信区间
举例说明置信区间的概念:
为了估计某候选人在选民中的支持率(即总体比值p),调查机构的民意测验可能会说,该候选人的“支持率为75%,误差是±3%,置信度是95%”。这种说法意味着下面三点:
1,样本中的支持率为75%,这是用样本比例作为对总体比例的点估计。
2,估计范围为75%±3%,即区间估计。
3,如果用类似的方式,重复抽取大量(样本量相同的)样本时,产生的大量类似区间中会有些覆盖真正的p,而有些不会,但这些区间中大约有95%会覆盖真正的总体比例。
这样得到的区间被称为总体比例p的置信度为95%的置信区间。置信度、样本量与区间之间的关系:
1,样本量相同时,置信度的增加导致区间变长;
2,置信度相同时,样本量的增加导致区间变短。
- 关于置信区间的注意点
不要认为由一个样本数据得到的总体参数的一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。置信度95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
网友评论