从数学上看,分布函数F(x)=P(X<x),表示随机变量X的值小于x的概率。这个意义很容易理解。概率密度f(x)是F(x)在x处的关于x的一阶导数,即变化率。如果在某一x附近取非常小的一个邻域Δx,那么,随机变量X落在(x, x+Δx)内的概率约为f(x)Δx,即P(x<X<x+Δx)≈f(x)Δx。换句话说,概率密度f(x)是X落在x处“单位宽度”内的概率。“密
度”一词可以由此理解。
1. 概率密度函数
假设有一元随机变量X,如果X是连续随机变量,那么可以定义它的概率
密度函数(probability density function, PDF) f(x),有时成为密度函数。
在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。它本身不是一个概率值, 可以大于1. 在xx上积分后才是概率值。
我们用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率,即
image.png image.png2. 概率质量函数
如果X是离散型随机变量,那么可以定义它的概率质量函数(probability mass function, PMF)pX(x)。概率质量函数 (Probability Mass Function,PMF)是离散随机变量在各特定取值上的概率。即,它本身就是一个概率值**。
与连续型随机变量不同,这里的PMF其实就是高中所学的离散型随机变量的分布律,即
image.png 比如对于掷一枚均匀硬币,如果正面令X=1,如果反面令X= 0。那么它的PMF就是 image.png
概率密度函数用数学公式表示就是一个定积分的函数,定积分在数学中是用来求面积的,而在这里,你就把概率表示为面积即可!
image.png
左边是F(x)连续型随机变量分布函数画出的图形,右边是f(x)连续型随机变量的概率密度函数画出的图像,它们之间的关系就是,概率密度函数是分布函数的导函数。
两张图一对比,你就会发现,如果用右图中的面积来表示概率,利用图形就能很清楚的看出,哪些取值的概率更大!所以,我们在表示连续型随机变量的概率时,用f(x)概率密度函数来表示,是非常好的!
但是,可能读者会有这样的问题:
Q:概率密度函数在某一点的值有什么意义?
A:比较容易理解的意义,某点的 概率密度函数 即为 概率在该点的变化率(或导数)。很容易误以为 该点概率密度值 为 概率值.
比如: 距离(概率)和速度(概率密度)的关系.
某一点的速度, 不能以为是某一点的距离
没意义,因为距离是从XX到XX的概念
所以, 概率也需要有个区间.
这个区间可以是x的邻域(可以无限趋近于0)。对x邻域内的f(x)进行积分,可以求得这个邻域的面积,就代表了这个邻域所代表这个事件发生的概率。
3. 累积分布函数
而不管X是什么类型(连续/离散/其他)的随机变量,都可以定义它的累积分布函数(cumulative distribution function ,CDF)FX(x),有时简称为分布函数。
CDF的定义是: image.png 对于连续型随机变量,显然有 image.png,那么分布函数CDF(FX(x))就是密度函数PDF(fX(t))的积分,PDF就是CDF的导数。
对于离散型随机变量,其CDF是阶梯状的分段函数,比如举例中的掷硬币随机变量,它的CDF如下
image.png 另外CDF的单调递增(不减)性质可以由它的定义和概率的性质推出,因为对任意x1<x2,总有 image.png ,所以 image.png4. 常用概率密度函数
正态分布是重要的概率分布。它的概率密度函数是:
image.png image.png
随着参数μ和δ变化,概率分布也产生变化。
image.pngX的方差为
image.png
更广泛的说,设g 为一个有界连续函数,那么随机变量g(X)的数学期望 image.png image.png
特征函数与概率密度函数有一对一的关系。因此,知道一个分布的特征函数就等同于知道一个分布的概率密度函数。
网友评论