误差变异系数

是从品种区域比较试验里看到的词

马育华、莫惠栋认为田间试验误差变异系数（CEV）小于12％，则试验误差
控制较好。在区域试验中，普遍认可的试验误差变异系数要求小于15％，即试验误差变异系数若大于15％，则表明该试验点的试验质量较差，其试验数据不予汇总统计。
来自《浙江省鲜食玉米品种区域试验的试验精确度与精度》

式中 Mse 为方差分析以中小区为单位的误差项均方，Y 为试验均值。CEV 越小，则试验精确度越高。

首先来说说，总体和样本

2个有啥区别啊？
举例子：我们做实验进行n个处理的所有样品，这就包括了目前你做的试验、以前曾经谁做的以及将来可能做的所有处理的集合，这在统计学中称为“总体”（我们做实验的处理永远只是总体的一部分，所以总体永远未知）。
在频率主义统计学的思想中，对于总体这么一个抽象性的概念，会有一个真值，它代表了这些个处理的总体趋势，但我们永远不知道它到底是多少。而我们做的一个个试验，都是这个总体中吐出的一个个“样本”，样本量越多，越接近（总体）真实值。
自然，每一个样本与那个未知真值的差，便是这个样本的随机误差。由于尺子本身不准、测量方法不正确（比如总是往一边歪着脑袋读数之类）等原因所导致的（这些原因导致的误差被称为“系统误差”），更不是由于人为疏忽而产生的。它是纯粹由于随机因素而产生的、无法消除的测量值与真值的偏差，因此被称为“随机误差”。

再来说说，标准差和标准误

两者的区别可以用一个例子来引入一下：

假设某一学校有1000名学生（将其作为一个总体），欲了解全校学生身高，随机抽取了100人，这100人的身高的波动范围就是标准差。这个标准差反映了在一次抽样中原始数据的波动情况。如果我们做了多次抽样，比如我抽了10次，每次仍然是100人，这样就有10个样本，每个样本中都是100人（注意：一次抽样叫做一个样本，你在一次抽样中抽取了100人，不能说你有100个样本，而是你有一个样本，样本中是100个人）。
对于抽取的10个样本，每个样本都可以计算一个均值，这样10个样本就可以计算出10个均值。将这10个均值作为原始数据，仍然可以计算出均值和标准差，这里的标准差就是标准误，它是用10个均值计算的，而标准差是用一次样本中的原始数据计算的。

标准差：是离均差平方的算术平均数（即：方差）的算术平方根，用σ表示。样本原始数据的标准差。
标准差反映了一个样本中原始数据的波动情况，标准差越大，表明原始数据之间差别越大。

任意一个正态分布（高斯分布）可以由两个参数确定，一个是它的均值（也叫位置参数）µ，决定它在数轴上的什么方位；一个是其标准差（也叫形状参数）σ，决定它的胖瘦。因此，我们把正态分布记为N( µ, σ)。

N(0,1)，也就是平均值为0，标准差为1的正态分布，称为“标准正态分布“

标准误：样本统计量的标准差。
如果样本之间波动小，可以理解为抽取的样本的代表性可能比较好，因为每次抽取计算的均值都差不多。所以可以用标准误来反映抽样误差的大小，如果标准误比较大，提示可能抽样误差较大，也就是说样本的代表性可能不好，抽取的样本有偏。

从公式可以看出，样本量越大，标准误越小，即样本量越大，样本的代表性越好
标准差和标准误明明是2个东西，公式上为什么是：标准差σ/例数n的平方根=标准误呢？

还有一个很实际的问题，可能有的人会说，实际中怎么可能多次抽样呢？不错，实际中的确很难做到多次抽样，我们通常只能抽取一次。但是我们仍然可以根据抽取一次的样本的原始数据计算（或者叫估算更为准确）标准误。这也就是统计书中给出的标准误的计算公式（所以从计算公式不能看出它的直观含义,如果你直接从公式出发理解标准误的含义还有可能会误导你），即标准差/例数的平方根。已经有统计学家都论证研究过了，用这个公式是可以代表样本之间的波动情况的。

	标准差	标准误
	一个样本里的个体之间区别有多大。	从一个population 里取多个样本，样本之间的区别有多大。
计算对象	根据一次抽样的原始数据计算的	根据多次抽样的样本统计量（可以是均值，也可以是率等）计算的
	只是一个描述性指标，只是描述原始数据的波动情况	是跟统计推断有关的指标，大多数的统计量计算都需要用到标准误。

统计量计算怎么用到标准误呢？举个例子：

很多统计量都跟标准误有关，以简单的t检验为例，可能以前有的人都没有注意过。仔细观察一下就可以发现，t检验统计量的分子是两组样本数据的均值差值，反映了样本数据的差异；分母是标准误，反映了抽样误差。所以t检验反映了什么呢？其实就是看到底是抽样误差大还是真实差异大。如果分母的抽样误差大，那就说明结果可能不可靠，所以P值就会比较大；如果分子的差异大，说明抽样误差造成这种差异的可能性不大，所以P值就会比较小。

图片.png