美文网首页玩转大数据大数据 爬虫Python AI Sql大数据
数据分析入门基础---统计学(笔记1,附学习资料)

数据分析入门基础---统计学(笔记1,附学习资料)

作者: 马小野 | 来源:发表于2018-08-13 16:33 被阅读10次

    文章仅为统计学基础知识的学习笔记,供快速查找。如果只需要电子书及视频学习资料,拉到文尾自行提取(无密码)。

    第一章 变量和图形

    统计学:科学方法收集、整理、汇总、描述和分析数据资料,并在此基础上进行推断和决策的科学;

    归纳统计学/统计推断:通过样本分析来给总体下结论

    描述性统计学/演绎统计学:值描述和分析特定对象而不下结论或推断

    变量、常量、连续变量、离散变量、连续数据、离散数据

    自变量、因变量、函数、单值函数、多值函数

    第二章 频数分布

    数组阵列:原始数据按照数量大小升序或者降序排列,最大值与最小值的差为全距;

    组距、组限、组界、组中值、直方图与频率多边形

    频率分布=某一组频数/总频数

    累计频数分布/累计频数表,累计频数多边形/卵形线

    累计频率分布/百分率累计频数=累计频数/总频数

    第三章 均值、中位数、众数及其他表示集中趋势的度量

    1、平均值/集中趋势的度量:趋向落在根据数值大小排列的数据的中心

    算术平均:

    加权算术平均:

    2、中位数:一组数根据数量大小排列后的做兼职或者两个中间值的算术平均值

    3、众数:一组数出现次数最多的那个数,众数不一定存在,也不唯一

    均值、中位数和众数之间的关系:

    4、几何平均G

    5、调和平均H

    算术平均、几何平均和平均之间的关系

    6、均方根RMS

    第四章 标准差和其他表示利差的度量

    离差/变差:数值数据围绕其平均值分布的分数与集中程度,常用的有全距、平均偏差、半内四分位数间距,10-90百分位数间距、标准差;

    1、全距:最大值-最小值

    2、平均偏差

    3、半内四分位数间距

    4、10-90百分位数间距

    5、标准差

    6、方差:标准差的平方

    离差度量间的关系

    第五章 矩、偏度和峰度

    1、矩

    2、r阶中心矩

    3、偏度:分布不对称程度或偏离对称程度的反映

    4、峰度:分布的陡峭程度,尖峰、扁峰、常峰态

    第六章 初等概率论

    1、概率

    2、条件概率,独立和不独立事件

    3、互不相容事件:两个或多个事件中,任意两个事件都不能同时发生

    4、概率分布

    离散型:离散型概率分布

    连续型:概率密度函数、连续型概率分布

    5、数学期望

    如果一个人活得S美元的概率为p,则他的数学期望=pS

    电子书资源:

    大数据的统计学基础  https://pan.baidu.com/s/1AwT9gav5pK0xcjhgc6YchQ

    统计学基本概念、统计学(第三版) https://pan.baidu.com/s/1BRhZgcGuDMelSuFWx4eLLA

    相关文章

      网友评论

        本文标题:数据分析入门基础---统计学(笔记1,附学习资料)

        本文链接:https://www.haomeiwen.com/subject/rgeubftx.html