美文网首页概率论与数理统计笔记
2.5.3 常用连续分布 - 指数分布

2.5.3 常用连续分布 - 指数分布

作者: Megahorn | 来源:发表于2019-05-14 22:44 被阅读0次
参考:
https://mp.weixin.qq.com/s/uP2hMlEInuZ6yxsEfkD_VQ
https://www.jianshu.com/p/6ee90ba47b4a

指数分布和泊松分布息息相关。

  • 指数分布解决的问题是“要等到一个随机事件发生,需要经历多久时间”
  • 泊松分布解决的是“在特定时间里发生n个事件的机率”。
  • 伽玛分布解决的问题是“要等到n个随机事件都发生,需要经历多久时间”
    所以,伽玛分布可以看作是n个指数分布的独立随机变量的加总,即,n个Exponential(λ)random variables--->Gamma(n,λ)


泊松分布的PDF可以用来表示一段时间内,发生概率稳定的小概率独立事件发生的情况;
反过来也可以通过单位时间内发生的次数\lambda相关的泊松分布PDF,与已有的概率密度观测值来推断发生概率是否稳定
例如

  • 每周卖出的罐头数
  • 每年发生的枪击案

举一个泊松分布的例子,类似于罐头库存:
馒头店老板统计了一周中每天卖出的馒头数,如下

销售数量
周一 3
周二 7
周三 4
周四 6
周五 5

从中可以得到最简单的规律,均值:
\overline{X}=\frac{3+7+4+6+5}{5}=5
从泊松分布一节可以知道每天卖出的馒头数X服从\lambda=\overline{X}的泊松分布,
记作X\sim P(\lambda),\lambda=\overline{X}=5
所以有
P(X=k)=\frac{\lambda^{k}}{k!}e^{-\lambda}
可求得概率密度与累计概率

每天卖出馒头数 概率密度 累计概率
0 0.0067 0.0067
1 0.0337 0.0404
2 0.0842 0.1247
3 0.1404 0.265
4 0.1755 0.4405
5 0.1755 0.616
6 0.1462 0.7622
7 0.1044 0.8666
8 0.0653 0.9319
9 0.0363 0.9682
10 0.0181 0.9863
11 0.0082 0.9945

概率密度分布如下:


image.png

讨论另外一个问题,馒头卖出之间的时间间隔:

image.png
可以看出也是随机变量(也就是图中的 ),不过相对馒头卖出个数而言,时间间隔肯定是连续的随机变量

既然都是卖馒头的问题,那么还是让我们从已知的泊松分布上想想办法。
之前得到的泊松分布让我们知道了每天卖出的馒头数,所以下面按天来分析看看。

设某一天没有卖出馒头,比如说周三吧,这意味着,周二最后卖出的馒头,和周四最早卖出的馒头中间至少间隔了一天:


image.png

当然也可能运气不好,周二也没有卖出馒头。那么卖出两个馒头的时间间隔就隔了两天,但无论如何时间间隔都是大于一天的:


image.png
而某一天没有卖出馒头(即k=0)的概率可以由泊松分布得出:

P(X=0)=\frac{\lambda^{0}}{0!}e^{-\lambda}=e^{-\lambda}

根据上面的分析,卖出两个馒头之间的时间间隔要大于一天,
那么必然要包含没有卖出馒头的这天,所以两者的概率是相等的。
如果假设随机变量为:

Y = 卖出两个馒头之间的时间间隔

那么就有
P(Y>1)=P(X=0)=e^{-\lambda}



之前求出的泊松分布实在限制太大,只告诉了我们每天卖出的馒头数。
不过没有关系,稍微扩展下可以得到新的函数:
P(X=k,t)=\frac{(\lambda t)^k}{k!}e^{-\lambda t}
其中\lambda t为一天,所以t表示\frac{1}{\lambda}天,有

t PDF
每天卖出的馒头数 1 P(X=k,1)=\frac{(\lambda)^{k}}{k!}e^{-\lambda}
\frac{1}{2}天卖出的馒头数 \frac{1}{2} P(X=k,\frac{1}{2})=\frac{(\frac{1}{2}\lambda)^{k}}{k!}e^{-(\frac{1}{2}\lambda)}
\frac{1}{8}天卖出的馒头数 \frac{1}{8} P(X=k,\frac{1}{8})=\frac{(\frac{1}{8}\lambda)^{k}}{k!}e^{-(\frac{1}{8}\lambda)}


两次卖出馒头之间的时间间隔大于t的概率,根据之前的分析,等同于t时间内没有卖出一个馒头的概率,
而后者的概率可以由泊松过程给出。至此所需的条件都齐备了,那么开始解题吧,假设随机变量:

Y = 卖出两个馒头之间的时间间隔

这个随机变量的概率可以如下计算:
P(Y>t)=P(X=0,t)=\frac{{\lambda t}^{0}}{0!}e^{-\lambda t}=e^{-\lambda t},t\geqslant0
进而有
P(Y\leqslant t)=1-P(Y>t)=1-e^{-\lambda t}
相当于得到了Y的累积分布函数
F(y)=P(Y\leqslant t)= \left\{\begin{matrix} 1-e^{-\lambda {y}},y \geqslant 0\\ 0\quad \quad \quad,y < 0 \end{matrix}\right.
对其求导就可以得到概率密度函数
p(y)= \left\{\begin{matrix} \lambda e^{-\lambda {y}},y \geqslant 0\\ 0\quad \quad,y < 0 \end{matrix}\right.

即Y = “卖出两个馒头之间的时间间隔”服从Y \sim Exp(\lambda)
参数\lambda为每天卖出的馒头数量观察值的平均值。

卖出两个馒头之间的时间间隔 PDF
1 0.9933
2 0.0067

这里单看PDF没有意义。
该分布的数学期望E(y)=\frac{1}{\lambda}=0.2
可理解为卖出两个馒头之间的时间间隔的均值是0.2天



推广到其他例子中:

  • 卖出每个罐头的时间间隔的平均值为\frac{1}{\lambda}
  • 每个枪击案发生的时间间隔的平均值为\frac{1}{\lambda}
  • TODO

相关文章

  • 2.5.3 常用连续分布 - 指数分布

    指数分布和泊松分布息息相关。 指数分布解决的问题是“要等到一个随机事件发生,需要经历多久时间” 泊松分布解决的是“...

  • 数据探索之统计分布

    本文用Python统计模拟的方法,介绍四种常用的统计分布,包括离散分布:二项分布和泊松分布,以及连续分布:指数分布...

  • 商务与经济统计第六章笔记

    连续性概率分布 连续性概率函数主要有三: 均匀分布,正态分布和指数分布。 1、均匀概率分布 均匀概率密度函数 连续...

  • 《商务与经济统计》第六章笔记

    连续型概率分布 连续型该路函数分三种: 均匀分布、正太分布和指数分布 1、均匀概率分布 均匀概率密度函数 连续型均...

  • 连续型概率分布

    连续随机变量 期望和方差 伽马函数 伽马分布 指数分布 卡方分布 正态分布

  • 指数分布

    泊松过程泊松过程.PNG 指数分布概念指数分布.PNG 指数分布期望和方差期望和方差.PNG 指数分布和几何分布指...

  • 指数分布

    天天学指数分布,愣是没整明白。简单记录: 指数分布是事件的时间间隔的概率 指数分布的概率密度:概率密度.png其中...

  • 泊松回归

    广义线性模型是围绕指数分布族的,大多数分布都属于指数分布族,比如:Bernoulli伯努利分布、Gaussian高...

  • 主题22:概率大题

    1.注意指数分布是寿命分布,≤0为0。 2.注意字母变换。 3.数字特征,指数分布和泊松分布的期望和方差。

  • 幂律分布与指数分布

    幂律分布和指数分布从图像上看貌似很像,但其实从公式出发就很容易发现其中的差异; 指数分布 ;两边取对数 幂律分布...

网友评论

    本文标题:2.5.3 常用连续分布 - 指数分布

    本文链接:https://www.haomeiwen.com/subject/cdojaqtx.html