美文网首页
样本容量 抽样水平 大数定理

样本容量 抽样水平 大数定理

作者: 飞猪的浪漫 | 来源:发表于2023-09-11 09:45 被阅读0次

    如果统计研究的设计和实施趋向于一个偏好的特定结果,那么它可能存在偏差

    偏差产生的途径有如下几种。

    ·如果样本中的个体在某些方面与总体的个体有区别,则说明该样本存在偏差。在这种情况下,研究结果将反映样本的特有性质,而不是总体的普遍特征。

    ·如果研究者倾向于某一特定结果,则会产生偏差。在这种情况下,研究者会有意无意地曲解数据含义。

    ·如果在收集数据时,有意无意地选择了不具有总体代表性的数据,则说明数据设定本身存在偏差。

    你可以每隔50个抽取一个芯片作为样本。此样本是一个代表性样本,因为每隔50个抽取的芯片与其他芯片相比没有任何特殊的规律特征。这种形式的抽样方法被称作系统抽样

    整群抽样是指将总体中的个体归类为随机的组或群。假设你在农业部门工作,并且想知道使用有机农业技术的农民所占的比例。如果用简单随机抽样或系统抽样去选取样本,会耗时耗力,因为需要去许多相距甚远的独立农场采集数据。使用某个县的农民作为任意样本又会出现偏差,因为不同地区的农业生产方式会有很大差异

    在统计术语中,50个州代表不同子组或层级。因为样本是从每个层级中随机选择得到的,所以该方法叫作分层抽样。

    简单随机抽样:选取的是容量相同且每个样本有同等概率被选择的样本。

    系统抽样:通过简单的系统抽取样本,比如在总体中每隔10个或每隔50个抽取样本。

    任意抽样:使用一个碰巧很容易被选择的样本。

    整群抽样:先将总体分成不同的组或群,然后从中随机挑选几个群作为样本。

    分层抽样:当我们注重总体中不同的子组或层级时,选择该方法进行抽样。首先定义层级,然后在每个层级中随机抽取样本。总样本包括所有从每个独立层中抽取的样本。

    如果在统计研究中一组测量值或观测值并不是由偶然因素造成的,就称为具有统计显著性

    一般我们通过概率判定统计显著性,用概率量化由偶然因素造成结果的可能性。首先回答一个问题,由偶然因素造成观察误差的概率是否小于等于0.05(1/20)?如果答案是肯定的话(概率小于等于0.05),我们就说这样的误差在0.05水平上显著

    ·如果由随机误差造成差异的概率小于等于0.05,则这种差异在0.05水平上显著。

    ·如果由随机误差造

    结果是指在观察或实验中出现的最基本的可能结果。

    事件是指一种或多种结果的集合,这些结果有相同特性。

    概率的表示

    用P(事件)表示一个事件的概率,其取值总是在0~1之间(包括0和1)。概率为0时,事件不可能发生;概率为1时,事件必定发生。

    步骤1:计算所有可能结果的总数。

    步骤2:在所有可能的结果中,计算由特性A所构成事件发生的次数。

    步骤3:得出概率,

    计算结果

    如果过程A有a种可能,过程B有b种可能结果,假设过程A、B之间的结果不会相互影响,不同结果的总数为a·b。这种思想适用于多个过程。例如过程C有c种可能结果,则三个过程的总结果数为a·b·c。

    得到事件A近似概率的第二种方法是频率方法(实证方法),通过大量的观测值,计算事件A发生的次数。例如,如果每年平均下雨的天数为100天,就可以得出随机选择一天下雨的概率是100/365

    ·理论概率假设所有结果发生的可能性一致,用一种事件发生的次数除以所有可能结果的总数。

    ·频率概率依据观察数据或者实验数据,就是某一事件的相关频率。

    ·主观概率是依据经验或者主观估计的数值。

    当单一事件无法预测结果时,大量事件可能会显示出一些特性。这种规律被称为大数定律(有时称为平均法则)。这一定律在统计学中具有重要的意义。

    大数定律

    大数定律适用于已知事件A的概率是P(A),且重复实验的结果并不依赖于先前实验结果(实验彼此之间相互独立)的实验过程。如果重复同一实验多次,事件A出现的概率将无限接近概率P(A)。实验次数越多,事件A发生的概率就越接近P(A)。

    考虑两个事件,每个事件都有自己的概率和值,则期望值为:期望值=事件1的值×事件1的概率+事件2的值×事件2的概率这一公式可以推广到计算多种事件的期望值。

    某一变量的期望值是对所有可能值的加权平均。这只是一个平均数,只有当大量事件发生时我们才能计算期望值,同时大数定律才会有效。

    考虑两个事件,每个事件都有自己的概率和值,则期望值为:期望值=事件1的值×事件1的概率+事件2的值×事件2的概率这一公式可以推广到计算多种事件的期望值。

    相关文章

      网友评论

          本文标题:样本容量 抽样水平 大数定理

          本文链接:https://www.haomeiwen.com/subject/peusvdtx.html