美文网首页
描述统计学

描述统计学

作者: 鲸鱼酱375 | 来源:发表于2019-06-08 22:40 被阅读0次

1.平均值:算术平均数,描述平均水平。

2.中位数:从小到大排列数据,取中间位置的数据,描述中等水平。

3.众数:数据中出现最多的数,描述一般水平。

众数只有在数据量很多的时候才有意义,当数据量较少时,不宜使用众数。当一组数据的分布偏斜程度较大时(信贷数据),使用中位数是一个较好的选择。当数据呈对称分布时,适合使用平均数,当数据为偏态分布时,特别是偏斜程度较大时,选择中位数或众数的代表性要比平均数好。

4.方差:数据在整体变化过程中偏离平均值的幅度,描述数据的离散程度

image.png image.png

5.标准差:平均值和标准差计算出来的,标准分=(原始数 - 平均值)/标准差;又叫标准化值。

均方差就是标准差,标准差就是均方差

image.png

为什么使用标准差?
与方差相比,使用标准差来表示数据点的离散程度有3个好处:

  • 表示离散程度的数字与样本数据点的数量级一致,更适合对数据样本形成感性认知。依然以上述10个点的CPU使用率数据为例,其方差约为41,而标准差则为6.4;两者相比较,标准差更适合人理解。
  • 表示离散程度的数字单位与样本数据的单位一致,更方便做后续的分析运算。方差与我们要处理的数据的量纲是不一致的,虽然能很好的描述数据与均值的偏离程度,但是处理结果是不符合我们的直观思维的。
  • 在样本数据大致符合正态分布的情况下,标准差具有方便估算的特性:66.7%的数据点落在平均值前后1个标准差的范围内、95%的数据点落在平均值前后2个标准差的范围内,而99%的数据点将会落在平均值前后3个标准差的范围内。
  • 方差和标准差都是对一组(一维)数据进行统计的,反映的是一维数组的离散程度

6.协方差

两个事件独立,协方差等于0,两个事件不相关


image.png

7. pearson相关系数

image.png

reference:
https://www.jianshu.com/p/de4b68edc01b
https://blog.csdn.net/xidiancoder/article/details/71341345
https://blog.csdn.net/zengxiantao1994/article/details/77855644

相关文章

  • 数据探索之参数估计

    统计学有两大主要分支,分别是描述性统计学和推断统计学。描述性统计学用于描述和概括数据的特征以及绘制各类统计图表。总...

  • 125、描述统计学基础

    学习数据分析最重要的基础之一是描述统计学,我推荐《深入浅出统计学》这本书,那什么是描述统计学呢? 描述统计学就是将...

  • 统计学基础知识一

    统计学可以分为:描述性统计学与推断统计学 描述统计学:使用特定的数字或图表来表现数据的集中程度和离散程度。例如:考...

  • 统计学2 集中趋势 总体样本 方差

    1、统计学分类statistic 1)描述统计学descriptive 2)推论统计学inferential 对样...

  • 初识统计学

    一、什么是描述统计学 官方定义:描述统计学(descriptive statistics)是研究如何取得反映客观现...

  • 《爱上统计学》——学习笔记

    Chapter1 什么是统计学(statistics)?统计学是描述一系列可用于描述/整理/解释资料或数据的统计工...

  • 统计与统计数据

    统计学的两个分支:描述统计和推断统计。 什么是描述统计呢?研究数据收集、整理和描述的统计学方法,包括如何取得所需数...

  • 统计学 - 数据描述

    前言 数据总是杂乱而大量的,我们需要快速抓住其特征,以此在脑海中形成一个实在的观念。我们看一个人,首先看外貌、形态...

  • 描述统计学

    术语中英对照 自变量 :independent variable 因变量 :dependent variable ...

  • 描述统计学

    研究方法入门 考虑因素: 测试样本 测试方法 样本数量 样本范围 隐藏变量 总体参数(总体均值)mu是用来描述整个...

网友评论

      本文标题:描述统计学

      本文链接:https://www.haomeiwen.com/subject/bhcqxctx.html