美文网首页玩转大数据
统计学与pandas学习(二)——平均值

统计学与pandas学习(二)——平均值

作者: fanzhh | 来源:发表于2017-10-23 13:52 被阅读62次

    第二章《平均值的作用和把握方法》。

    统计量是概括数据的数值

    所谓统计量,是“用一个数字来概括数据的特征”。具体说就是“平均值”、“方差”和“标准方差”。

    平均值

    “用数据的合计除以数据数“得到的东西。

    频数分布表上的平均值

    以女大学生身高为例:

    A 组值 B 相对频数 AxB
    143 0.0125 1.7875
    148 0.075 11.1
    153 0.2375 36.3375
    158 0.375 59.25
    163 0.225 36.675
    168 0.075 12.6
    AxB的合计=(平均值) 157.75

    组数x相对频数的合计=平均值。因为频数分布舍弃了原始数据的一部分信息,所以此平均值与原始数据取得的平均值有差别。

    平均值的性质

    • 数据分布在平均值周边。
    • 多次出现的数据对平均值有大的影响。
    • 在直方图呈左右对称的情况下,平均值在对称轴的位置上。

    练习

    根据虚构的数据,填好频数分布图,计算平均值。

    组值 频数 相对频数 组值x相对频数
    30 5 0.05 1.5
    50 10 0.1 5
    70 15 0.15 10.5
    90 40 0.4 36
    110 20 0.2 22
    130 10 0.1 13
    合计100 合计(平均值)88

    计算平均值的4种方法

    1. 算数平均数:数值相加除以数值个数
    2. 几何平均数:数值相乘,对乘积开平方
    3. 均方根值:数值相加,和除以2,对结果开平方
    4. 调和平均数:1分别除以数值然后相加,2除以相加的和

    相关文章

      网友评论

        本文标题:统计学与pandas学习(二)——平均值

        本文链接:https://www.haomeiwen.com/subject/uuqauxtx.html