关于均方误差的学习
在2018年9月18日晚自习时间,我们学习了关于机器学习的一部分内容,其中有一小块是关于均方误差的,那么我就向大家解释一下什么是均方误差吧!
所谓均方误差,即反映估计量与被估计量之间差异程度的一种度量。设t是根据子样确定的总体参数θ的一个估计量,(θ-t)2的数学期望,称为估计量t的均方误差。它等于σ2+b2,其中σ2与b分别是t的方差与偏倚。
那么先给大家区分一下方差、标准差、均方误差吧!
方差
百度百科中关于方差的解释为:(variance)是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。 方差是衡量源数据和期望值相差的度量值。 假设有一组离散的数据xn=[x1,x2,x3,x4........xn]xn=[x1,x2,x3,x4........xn]。数据的均值:x¯¯¯=∑n1xinx¯=∑1nxin,则数据的方差为var=∑n1(x−x¯¯¯)2nvar=∑1n(x−x¯)2n 。
标准差
标准差(Standard Deviation) ,又称为均方差,但是离均差平方的算术平均数的平方根。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确。
而标准差和方差具有开平方的关系,即:
均方误差
均方差与均方误差(mean squared error,MSE)不同,均方误差是各数据偏离真实值的距离平方和的平均数,也即误差平方和的平均数,用σ表示。均方误差可以用在机器学习中的损失函数,用于预测和回归。均方误差的公式为:
最后,三者关系为:
1、均方差就是标准差,标准差就是均方差
2、均方误差不同于均方误差
3、均方误差是各数据偏离真实值的距离平方和的平均数
均方误差(Mean Squared Error, MSE)
在相同测量条件下进行的测量称为等精度测量,例如在同样的条件下,用同一个游标卡尺测量铜棒的直径若干次,这就是等精度测量。对于等精度测量来说,还有一种更好的表示误差的方法,就是标准误差。
标准误差定义为各测量值误差的平方和的平均值的平方根。
设n个测量值的误差为ε1、ε2……εn,则这组测量值的标准误差σ等于:
数理统计中均方误差是指参数估计值与参数真值之差平方的期望值,记为MSE。MSE是衡量“平均误差”的一种较方便的方法,MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。与此相对应的,还有均方根误差RMSE、平均绝对百分误差等等。
————2017级卓工班 蒲虹宇
网友评论