分布

作者: 鲸鱼酱375 | 来源:发表于2019-06-15 05:15 被阅读0次

    数据分布形态
    一组或一系列数字,落在坐标图里的形态特征。比如:正态分布。

    1.正态分布 Normal distribution

    1.1 定义

    image.png

    又名高斯分布 Gaussian distribution
    若随机变量X服从一个数学期望为μ,标准方差为σ^2的高斯分布

    1.2 正态分布的特征

    • 正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ2):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平。
    • u变换:为了便于描述和应用,常将正态变量作数据转换。μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以X=μ为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ。
    • σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
    • 3σ原则:P(μ-σ<X≤μ+σ)=68.3%P(μ-2σ<X≤μ+2σ)=95.4%P(μ-3σ<X≤μ+3σ)=99.7%

    2.卡方分布

    卡方分布是从正态分布中衍生出的一种分布。其定义是若干个随机变量的平方和也服从一种分布,即卡方分布。
    卡方分布:常用于拟合优度检验

    image.png

    3.t分布

    t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析

    image.png

    4.f分布

    image.png

    5.区别:

    卡方分布:常用于拟合优度检验
    t分布: 多用于比例的估计和检验,用于方差分析,协方差分布和回归分析
    t分布: 在信息不足的情况下,只能用t分布,比如在整体方差不知道的情况下,对总体均值的估计和检验常用t统计量

    6.伯努利分布 两点分布

    伯努利分布是二元分布 - 它只需要两个值(0 或 1),概率为p
    可以求期望 E(x) 方差D(x)


    image.png

    7.Gamma 分布

    Gamma 分布是由两个参数定义的连续概率分布。
    给定不同的参数,伽玛分布可能看起来非常不同。探索不同的参数。
    指数分布在技术上是 Gamma 分布的一个特例,但也在 scipy 中单独实现为expon。

    8.Beta 分布

    Beta 分布是在区间[0,1]上定义的分布,由两个形状参数定义


    image.png
    image.png

    9.泊松分布

    在给定已知平均速率(和独立出现)的情况下,泊松分布建模了固定时间间隔的事件。


    image.png
    image.png

    10.二项分布

    image.png

    11.均匀分布

    image.png

    12.指数分布

    image.png
    image.png
    image.png

    但有可能与实际不符,那就加个参数

    13. sigmoid函数

    image.png
    image.png

    reference:
    https://blog.csdn.net/back_to_dream/article/details/51361431
    https://blog.csdn.net/renwudao24/article/details/44463489
    截图来自YouTube

    相关文章

      网友评论

          本文标题:分布

          本文链接:https://www.haomeiwen.com/subject/qclbxctx.html