美文网首页
误差 估计

误差 估计

作者: 飞猪的浪漫 | 来源:发表于2023-09-10 14:59 被阅读0次

    然而,统计科学表示,只要统计研究设计精准,这个结论就相当准确。

    总体:在统计研究中,总体是所研究的人或事物的完整集合。

    总体参数:总体中对某变量的概括性描述。

    们通常认为总体表示一群人,其实它可以是任意一个群体——人、动物或者事物。例如,在一个有关汽车安全的研究中,总体可以是在路上行驶的所有车辆

    b.总体包括每周运输过来的用于炸薯条的土豆重量。相关的总体参数是土豆的平均重量,以及其重量的差异(例如,大多数每周用量是接近还是远高于平均值)。

    c.总体包含所有患白血病的儿童。其中重要的总体参数是没有用新治疗办法就痊愈的儿童百分比以及使用新治疗办法后痊愈的儿童百分比。

    样本是总体的一个子集,它的数据是进行实际测量而获得的。

    原始数据是对样本进行实际测量或观测所收集的数据。

    样本统计量是描述从原始数据中筛选总结的样本特征的数据。

    案 a.总体是美国劳工部想要研究的构成城市劳动力的群体。

    b.样本是指60000个家庭调查中的所有人。

    c.原始数据是指调查中收集到的所有信息。

    d.样本统计量是对样本中原始数据的总结。在本例中,相关样本统计量是指积极寻找工作的人所占的百分比(劳工部同样也计算其他样本统计量,如青年、男性、女性和退伍军人的失业率)。

    换句话说,他们希望得出结论,因为样本中31%的人观看超级碗,所以总体中也会有近31%的人观看。统计学的一个主要目标就是帮助调查者评估这类推论的有效性如果我们选用更大的样本容量,就会发现样本均值的抽样分布更像正态分布(源于5.3节讨论过的中心极限定理)

    抽样误差

    抽样误差是指一个随机样本被用来估计总体参数时所产生的误差。它不包括源于其他的误差,比如偏性抽样、质量不高的调查问题或者记录错误。

    然而,如果能够计算总体中所有的样本均值,我们将会发现它们的分布与正态分布没有差别,其平均值等于总体均值(该案例中为3.88),而且其标准差等于总体标准差与样本容量开方之比的值,即一个通用的准则是:如果样本容量大于30,样本均值的分布接近正态分布。

    样本均值分布的特征

    对于任何样本均值的分布:

    ·样本容量越大,样本均值的分布越接近正态分布;

    ·总体中所有样本均值的平均值与总体均值相等;

    ·总体中所有样本均值的标准差的表达式为[插图]。

    用样本均值估计总体均值

    假设计算出样本均值,它来自于总体的一个样本。接下来估计总体均值:

    (1)因为只有一个样本均值,我们把它当作总体均值最佳(唯一)的估计量;

    (2)基于样本容量和样本标准差(s),计算误差的范围,并用它建立一个置信区间,然后可以陈述估计总体均值的质量有多高。

    置信区间是一定范围的值,它很大可能地包含总体均值的真实值。

    回想一下,样本均值的抽样分布近似于样本均值等于总体均值μ的正态分布。因此,正态分布的68-95-99.7规则(见5.2节)告诉我们,大约95%的样本均值在总体均值两边2个标准差之内

    想一下,所有可能的样本中,95%的样本均值都在总体均值2个标准差以内。因此,如果多次重置抽样以及构建置信区间,那么95%的置信区间将会包含总体均值(μ),而5%的则不包含。

    样本容量的公式假设置信水平为95%。如之前讨论的那样,更准确的公式会使用1.96而不是2。本节内容的方法是,如果总体标准差未知,就使用样本标准差s来作为总体标准差的估计值。只有样本容量足够大时,这个结果才理想。如果从非正态分布中抽取小样本,那么用s来代替σ结果将会很差。

    相关文章

      网友评论

          本文标题:误差 估计

          本文链接:https://www.haomeiwen.com/subject/zoysvdtx.html