美文网首页
平均数和标准差

平均数和标准差

作者: 崔吉龙 | 来源:发表于2019-03-09 10:53 被阅读0次

在机器学习中,平均数表示的是所有样本的平均值,也是所有样本的中心点。
平方差:所有样本到中心点距离的平方和
标准差:平方差/n得到平均平方差,然后再开根号。

numpy里有这些函数,
那么我们就可以知道了
平均数是这些数的中心,标准差是这些数到中心点的平均距离,表示的是这些点的离散程度,这个数越大,表示越离散。

X = np.array([1, 2, 3])
X.mean()

2.0
X.std()
0.816496580927726
什么情况怎么是0.8几,距离难道不是1吗?其实这里涉及一个知识,就是全体样本平方差还是样本平方差,全体平方差包括所有的元素,而样本平方差要排除中心点本身,也就是让全体样本中的中心点被排除在外。
也就是numpy里计算的是全体标准差,sqrt(((3-2)2+(1-2)2)/2)

从这个地方我们引入机器学习里边常说的标准问题

标准化就是让原始的数据格式化:
1、让平均值为0,让标准差(表示距离)为0
这个简单让每个值都减去平均值再除去标准差。
当时要注意一点,所谓的标准化,只能标准化一列,就是一个特征变量里的所有的数据。这样是让每个特征按照自己的比例进行标准化,但是不能和别列的数据进行混合,因为不同的列是不相关的数据,你如果做了标准化,就会让不同的列的数据也相关了,这个是有问题的。

相关文章

  • 赤裸裸的统计学(九):中心极限值定律

    整体有标准差,平均数。 抽样也有标准差,平均数。 抽样的平均数分布在整体平均数的左右,呈正态分布...

  • 方差与标准差

    标准差定义是总体各单位标准值( xi)与其平均数(μ)离差平方和的算术平均数的平方根[https://baike....

  • 平均数和标准差

    在机器学习中,平均数表示的是所有样本的平均值,也是所有样本的中心点。平方差:所有样本到中心点距离的平方和标准差:平...

  • 标准差,协方差,相关系数

    1.标准差 标准差定义是总体各单位标准值与其平均数离差平方的算术平均数的平方根。它反映组内个体间的离散程度 公式为...

  • 测量学中的几种误差

    均方根误差与标准差区别 标准差(STD):观测值与其平均数偏差的平方和的平方根。它反映组内个体间的离散程度。 均方...

  • 方差与标准差

    标准差(StandardDeviation),也称均方差(meansquareerror),是各数据偏离平均数的距...

  • Python入门:数值分析

    教程来自扇贝编程 数值分析:平均数、中位数、分位数、众数、极差、方差、标准差 均值 均值也称为平均值或平均数。它等...

  • T分布

    小样本时,母体标准差未知(一般情况),抽样平均数的概率 服从 T分布。

  • 统计学中的基本概念和重要公式(二)

    1.样本平均数:2.总体平均数:3.四分位差:4.方差:(1)总体方差:(2)样本方差: 5.标准差:(1)总体标...

  • 方差、标准差、期望与归一化

    什么是方差?若x1,x2,x3......xn的平均数为M,则方差公式可表示为: 什么是标准差?标准差是方差的算术...

网友评论

      本文标题:平均数和标准差

      本文链接:https://www.haomeiwen.com/subject/refgyqtx.html