概率分布的选择取决于建模数据的类型和定义域,描述数据类型为离散值的概率分布即为本章所回顾的离散概率分布。本章主要回顾伯努利分布,分类分布,二项分布以及泊松分布。
离散概率分布
伯努利分布(Bernoulli distribution)
伯努利分布又叫两点分布或者0-1分布,描述的是只有两种随机变量取值的分布,其定义域。伯努利分布式日常生活中很常见的一个分布,用于模拟具有两种状态的事件。
参数:伯努利分布仅有一个单参数,它定义随机变量取1的概率。
因此:
可表示为
期望:
方差:
分类分布(Categorical distribution)
分类分布用来观察k个可能结果的概率,是伯努利分布的泛化,其定义域。在计算机视觉里面我们也常常会遇到,例如像素点的取值概率是一个离散的分类分布。
可表示为
期望:
期望值与定义域取值有关
二项分布(Binomial distribution)
是个独立的伯努利试验中成功的次数的离散概率分布,其中每次试验的成功概率为
n次试验中正好得到k次成功的概率可表示为
一般的二项分布是n次独立的伯努利试验的和。它的期望值和方差分别等于每次单独试验的期望值和方差的和,因此,
期望:
方差:
泊松分布(Poisson distribution)
泊松分布是用于描述单位时间内随机事件发生的次数的概率分布。例如已知某服务器一天被攻击的次数是每天2次,那么在此处一天内发生k次事故的概率是多少 ,这样我们就可以用泊松分布来求。
泊松分布的概率公式可以由二项分布推导而来。当二项分布的n很大而概率p很小时,泊松分布可作为二项分布的近似,其中。
也就是说,在二项分布中,观察足够长的时间,且每个单位时间内发生概率足够小时,二项分布便可由泊松分布来表示
参数是单位时间(或单位面积)内随机事件的平均发生率,k为发生的次数
服从泊松分布的随机变量其数学期望与方差相等,同为参数λ:
此外,两个独立且服从泊松分布的随机变量,其和仍然服从泊松分布
附证明,其中:
网友评论