美文网首页R
误差线用的是啥?

误差线用的是啥?

作者: 天道昭然 | 来源:发表于2021-03-17 13:29 被阅读0次

    科研作图常用到误差线,但是你知道误差线对应的表示到底是标准差还是标准误呢?其实……都可以!此外还可以用特定的置信区间(譬如,95%的区间)来表示。
    误差线主要指示数据每一个数据点的误差(或不确定性)范围,显示潜在的误差或相对于系列中每一数据标志的不确定程度,以更准确的方式呈现数据。
    无论是利用标准差(Standard deviation SD)、标准误(或称标准误差,Standard error,SE)或者是置信区间(Confidence interval,CI),科技论文写作和发表都是接受的,重点是在论文中明确说明属于哪一种即可。
    那么这些不同的表示方法,计算过程有什么不一样呢?

    标准差


    标准差,是离均差平方的算术平均数的平方根,用σ表示,(总体)标准差的计算公式如下:

    公式中数值X1,X2,X3,……XN(皆为实数),其平均值(算术平均值)为μ,标准差为σ。
    注意:
    在部分公式中,根号内常除以自由度(N-1)而非N,主要是因为:
    如是总体(即总体标准差),根号内除以N,多用σ表示(对应Excel函数:STDEVP);
    如是抽样(即样本标准差),根号内除以(N-1),多用s表示(对应Excel函数:STDEV);

    因为我们大量接触的是样本,所以普遍使用根号内除以(N-1),故,在抽样统计样本标准差,计算公式是:

    实际情况下,而往往因总体标准差未知,常用样本标准差来估计总体标准差。由此,误差线的范围可以表示为以下两种:

    图片

    标准误


    标准误,也称均方根误差,标准误的计算公式如下:

    σ表示总体标准差,n为样本数。当总体标准差未知是,利用样本标准差进行估计:

    而误差线的范围也就可以表示为:

    置信区间


    它指样本统计量所构造的总体参数的估计区间,涉及了区间估计(点估计)。置信区间的计算需要根据σ是否已知以及样本量的不同分别进行估计。

    1、σ(总体标准差)已知,或未知但为大样本(一般样本量大于等于30),认为样本平均数近似服从正态分布:

    从而进行区间估计获得:

    σ(总体标准差)已知可以直接计算标准误,未知则先由样本标准差s估计总体标准差再进行计算:

    z*可以通过正态分布检验查表获得,不同的置信度数值不同,常见置信度(C)数据如下(双侧):

    譬如常见的0.95置信区间 是1.96倍的标准误(误差线的范围也就如下):

    2、σ(总体标准差)未知,且为小样本(一般样本量小于30,很多生物研究类实验样本量往往少于30且σ未知),则选择t-分布:

    t*也是通过t-检验查表获得,其数值与置信度以及自由度(n-1)有关(此处适用于双侧):

    图片

    举个栗子来说,一般设置三个生物学重复测量数据n=3(自由度为2),0.95置信区间对应 t*是4.303,也就是4.303倍的标准误(误差线范围):

    图片

    相关文章

      网友评论

        本文标题:误差线用的是啥?

        本文链接:https://www.haomeiwen.com/subject/kezscltx.html