marginal distribution,边缘分布(有时也翻译成边界分布)。
如果我们把每一个变量的概率分布称为一个概率分布,那么边缘分布就是若干个变量的概率加和所表现出的分布。举个例子,假设P(B),P(C),P(A|B),P(A|C)已知,求P(A)。那么P(A)=sum(P(B)P(A|B),P(C)P(A|C))。
再举个简单的例子:对于一个任意大小(n*n)的概率矩阵X,每一个元素表示一个概率,对于其中任一行或任一列求和,得到的概率就是边缘概率。如果写成式子,就是第i行有以下边缘分布:P(i)=sum(P(i,j),for each j in n)。
对,定义就是这么简单。就是指的某一些概率的加和值的分布,其实就对应一个等式,让它等于某种概率加和运算。
为什么叫"marginal"呢?是因为这个值曾经用于表示某一个概率矩阵中某一行或某一列的概率加和,而这个加和在table中往往放在margin(表头)的位置,所以叫marginal distribution,翻译过来变成了边缘概率
# def marginal(joint, axis):
# """Compute a marginal distribution.
# axis=0 returns the marginal distribution of the first variable
# axis=1 returns the marginal distribution of the second variable
# joint: DataFrame representing a joint distribution
# axis: int axis to sum along
# returns: Pmf
# """
# return Pmf(joint.sum(axis=axis))
网友评论