标准差(StandardDeviation),也称均方差(meansquareerror),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。方差是各个数据与平均数之差的平方的平均数。公式:1、方差s=[(x1-x)^2+(x2-x)^2+(xn-x)^2]/n(x为平均数)2、标准差=方差的算术平方根它们的意义:1、方差的意义在于反映了一组数据与其平均值的偏离程度;2、方差是衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。3、方差的特性在于:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。4、标准差是方差的算术平方根,意义在于反映一个数据集的离散程度。
我们可以代入期望的数学表达形式。比如连续随机变量:
Var(X)=E[(X−μ)2]=∫+∞−∞(x−μ)2f(x)dx
方差概念背后的逻辑很简单。一个取值与期望值的“距离”用两者差的平方表示。该平方值表示取值与分布中心的偏差程度。平方的最小取值为0。当取值与期望值相同时,此时不离散,平方为0,即“距离”最小;当随机变量偏离期望值时,平方增大。由于取值是随机的,不同取值的概率不同,我们根据概率对该平方进行加权平均,也就获得整体的离散程度——方差。
方差的平方根称为标准差(standard deviation, 简写std)。我们常用σ表示标准差
σ=Var(X)−−−−−−√
标准差也表示分布的离散程度。
正态分布的方差
根据上面的定义,可以算出正态分布
E(X)=1σ2π−−√∫+∞−∞xe−(x−μ)2/2σ2dx
的方差为
Var(X)=σ2
正态分布的标准差正等于正态分布中的参数σ。这正是我们使用字母σ来表示标准差的原因!
网友评论