分布

作者: 鲸鱼酱375 | 来源:发表于2019-06-15 05:15 被阅读0次

数据分布形态
一组或一系列数字,落在坐标图里的形态特征。比如:正态分布。

1.正态分布 Normal distribution

1.1 定义

image.png

又名高斯分布 Gaussian distribution
若随机变量X服从一个数学期望为μ,标准方差为σ^2的高斯分布

1.2 正态分布的特征

  • 正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ2):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。
  • u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。
  • σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
  • 3σ原则:P(μ-σ<X≤μ+σ)=68.3%P(μ-2σ<X≤μ+2σ)=95.4%P(μ-3σ<X≤μ+3σ)=99.7%

2.卡方分布

卡方分布是从正态分布中衍生出的一种分布。其定义是若干个随机变量的平方和也服从一种分布,即卡方分布。
卡方分布:常用于拟合优度检验

image.png

3.t分布

t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析

image.png

4.f分布

image.png

5.区别:

卡方分布:常用于拟合优度检验
t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析
t分布: 在信息不足的情况下,只能用t分布,比如在整体方差不知道的情况下,对总体均值的估计和检验常用t统计量

6.伯努利分布 两点分布

伯努利分布是二元分布 - 它只需要两个值(0 或 1),概率为p
可以求期望 E(x) 方差D(x)


image.png

7.Gamma 分布

Gamma 分布是由两个参数定义的连续概率分布。
给定不同的参数,伽玛分布可能看起来非常不同。探索不同的参数。
指数分布在技术上是 Gamma 分布的一个特例,但也在 scipy 中单独实现为expon。

8.Beta 分布

Beta 分布是在区间[0,1]上定义的分布,由两个形状参数定义


image.png
image.png

9.泊松分布

在给定已知平均速率(和独立出现)的情况下,泊松分布建模了固定时间间隔的事件。


image.png
image.png

10.二项分布

image.png

11.均匀分布

image.png

12.指数分布

image.png
image.png
image.png

但有可能与实际不符,那就加个参数

13. sigmoid函数

image.png
image.png

reference:
https://blog.csdn.net/back_to_dream/article/details/51361431
https://blog.csdn.net/renwudao24/article/details/44463489
截图来自YouTube

相关文章

网友评论

      本文标题:分布

      本文链接:https://www.haomeiwen.com/subject/qclbxctx.html