美文网首页
概率笔记1

概率笔记1

作者: 徐有钱 | 来源:发表于2020-05-16 10:09 被阅读0次

    1. 什么是概率

    P(x) = 0.5

    事件x发生的概率是50%

    • 频率派的概率(可以重复的事件)
      • 抛一枚硬币,正面向上的概率是 50%
      • 抛一千词硬币,正面向上的次数大约是500词
    • 贝叶斯派的概率
      • 病人患流感的概率是0.5
      • 医生对诊断的把握是五五开(不可重复事件的信念)

    2. 什么是随机变量

    随机变量是可以随机的取不同值的变量

    • 抛硬币
      • x ∈ {正面,反面}
    • 掷骰子
      • x ∈{1,2,3,4,5,6}

    一个随机变量是对可能状态的描述,他必须伴随一个概率分布来指定每个状态的可能性

    用 Ω 变量表示随机变量状态的可能性

    3.概率分布

    3.1 离散性概率分布

    概率质量函数:将随机变量取得的每个状态映射到随机变量取得该状态的概率

    直白一点就是接收所有可能随机变量,返回所有随机变量的概率。

    \begin{cases}P(x=正面向上) = 0.5 \\P(x=反面向上) = 0.5 \\\end{cases}
    如果一个函数P是随机变量x的概率质量函数,那么函数必须满足以下条件

    • P的定义域必须是x所有可能的状态集合

    • 对于任意x, 0≤P≤1,不可能发生的事件概率为0,必然发生的事件概率为1

    • 归一化条件

      ∑P(x) = 1

    3.2 离散型均匀分布

    给定一个离散型随机变量x,有k个可能的状态(x_1, x_2, …, x_k),每个状态的可能性是相同的,即均匀分布(uniform distribution),则其概率分布为
    P(x=xi) = \frac{1}{k}

    \sum_1^k p(x=xi) = \sum_1^k \frac{1}{k} = 1

    3.3 连续型概率分布

    比如一天的温度值就属于连续型概率分布

    概率密度函数

    如果一个函数是概率密度函数(Probability Density Function, PDF),必须满足以下条件

    • p的定义域必须是x所有可能状态的集合

    • •∀x, p(x)≥0(对于任意x,p(x)>0)

      • •不要求p(x)≤1
    • \int P(x)dx = 1

    • p(x)没有直接给出特定状态的概率,而是:落在面积为δx的无限小区域内的概率为p(x)δx

    • 因为要求积分和为1,因此对于单个x的p(x)的值可以大于1

    在这里插入图片描述

    假设一个人的体温是 36-42 的均匀分布

    • 一个人体温是 37-38 之间的概率是
      • P(<37x<38) = 1/6
    • 一个人体温恰好是 37 的概率是
      • 相当于问一条线的面积是多少:0

    4. 联合概率、边缘概率、条件概率

    4.1 联合概率

    如果随机变量x, y相互独立,联合概率为:P(x=x_i, y=y_i )=P(x=x_i )P(y=y_i )

    比如我同时进行抛硬币和投骰子两个事件

    x 表示 骰子的点数 P(x=1=2=3=4=5=6) = 1/6

    y = 1 表示硬币正面向上,y = 0 表示反面向上 p(y=0=1) = 1/2

    联合概率分布表

    x=1 x=2 x=3 x=4 x=5 x=6
    y=0 P(x=1,y=0)=1/12 P(x=2,y=0)=1/12 P(x=3,y=0)=1/12 P(x=4,y=0)=1/12 P(x=5,y=0)=1/12 P(x=6,y=0)=1/12
    y=1 P(x=1,y=1)=1/12 P(x=2,y=1)=1/12 P(x=3,y=1)=1/12 P(x=4,y=1)=1/12 P(x=5,y=1)=1/12 P(x=6,y=1)=1/12

    P(x=1,y=1) = P(x=1)*P(y=1) = 1/6 * 1/2 = 1/12

    4.2 边缘概率

    某一组概率的加和叫做边缘概率

    比如我要求骰子数字为1的概率

    P(x=1) = P(x=1,y=1) + P(x=1,y=0) = 1/6

    练习

    双眼皮在人群中占比为 1/3 卷舌在人群中 占 1/4 ,且这两个性状相互独立,现在在人群中随机抽一人,用X表示眼皮性状,Y表示卷舌形状,求X,Y 的联合分布 和X 的边缘分布

    X = 双眼皮 X=单眼皮
    Y = 卷舌 1/12 2/12
    Y = 不卷舌 3/12 6/12

    \begin{cases} P(x=双眼皮) = 1/12+3/12=4/12\\ P(x=单眼皮) = 2/12+6/12=8/12 \end{cases}

    4.3 条件概率


    P(x=x_i)

    已经发生的前提条件下
    P(y=y_i)

    发生的概率为

    P(y=y_i|x=x_i) = \frac{P(x=x_i,y=y_i)}{P(x=x_i)}
    已知一个人是双眼皮,他是卷舌的概率是
    P(y=卷舌|x=双眼皮) = \frac{P(x=双眼皮,y=卷舌)}{P(x=双眼皮)}=\frac{1/12}{1/3}=\frac{1}{4}

    5. 独立性与条件独立性

    5.1 独立性

    开始我们举得例子里说投骰子和抛硬币是相互独立的,但是我们如何用数学语言证明两件事情是相互独立的?

    如果两件事情X,Y 是相互独立的

    那么必然满足

    • 条件概率与条件无关
      P(X|Y) =P(X|Y ̅ )
      Y 成立时X 成立的概率与 Y 不成立时X 的概率相等

    • 添加去除条件无影响
      P(X) = P(X|y)

    • 联合概率等于边缘概率乘积
      P(X,Y) = P(X)*P(Y)

    以上三个条件满足一个就可以说X 跟Y相互独立

    容易混淆的地方

    • 随机变量X,Y相互独立:没有关系,不能相互提供线索

    • 独立不是均匀

      • 独立的例子

        • P(Y|X_1) = P(Y|X_2)= P(Y|X_2)= P(Y|X_3) = ... = P(Y|X_i)
      • 均匀的例子

        𝑃(𝑌_1│𝑋)=𝑃(𝑌_2│𝑋)=…=𝑃(𝑌_𝑖│𝑋)

    • 独立不是互斥

    • 互斥一定不独立(能够相互提供线索)

    案例

    想在有一个测谎机,我如何验证测谎机是否有效?

    我可以预先说谎让机器测量,然后检测说谎跟机器的检测结果是否独立,如果独立说明测谎机无效

    X = 1 表示说谎 X = 0 表示没说谎

    Y = 1 表示机器认为我说谎 Y = 0 表示机器认为我没说谎

    如果

    P(X=1) = P(X=1|PY=1)

    那说明测X 跟Y是相互独立的事件

    5.2 条件独立性

    随机变量X,Y在Z取特定值的条件下独立:

    P(X,Y|Z)=P(X|Z)P(Y|Z)

    注意区分:

    P(X,Y|Z)=P(X)P(Y|Z)

    P(X,Y|Z)=P(X|Z)P(Y)

    并不是条件独立

    6. 期望

    6.1 定义

    抛一枚均匀的硬币,若正面向上,你给我100元;否则我给你50元,你是否愿意接受一次挑战?一百次呢?

    我们可以用期望来计算收益的平均值

    期望是指是试验中每次可能结果的概率乘以其结果的总和

    用X 表示收益

    那么期望
    E = -100*P(X=-100)+50*P(X=50) = -100*0.5 + 50*0.5 = -25
    平局每次会亏25元

    对于离散性分布,公式为
    E(X) = \sum k*P(x=k)
    对于连续性分布,公式为
    E[x]= \int f(x)p(x)dx
    比如这里一个人的体温是35-42 之间 p(x)dx 是指某个温度的概率 f(x) 是温度的具体值

    案例

    投一枚骰子,所得点数的期望值是
    E[x]=1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6=3.5
    已知随机变量X的概率分布:

    P(X=1)=1/2, P(X=2)=1/3, P(X=5)=1/6

    求E[(X-3)^2]
    $$
    P(Y=4)=P(X=1)+P(X=5)=1/2+1/6=2/3 \

    P(Y=1)=P(X=2)=1/3 \

    E[(X-3)^2] = 2/3 * 4 + 1/3*1 = 3
    $$

    6.2期望的数学性质

    可以直接记住结论

    • 投骰子的点数期望是3.5 如果 每个骰子的值都加一,那么骰子点数的期望为 4.5,公式表达为

    E(X+c) = E(X) +c \\ E(X+c) = \sum(X+c)P(X)\\ =\sum XP(X) + \sum cP(X) \\ = E(X) + c\sum P(X) \\ = E(x) + c

    • 如果每个骰子的值都乘以2 ,那么骰子的点数期望为 7,公式表达为

    E(cx) = \sum cxP(x) = c\sum xP(x) = cE(x)

    • X 事件为投骰子, y 事件为抛硬币,正面计1 反面计2 求 骰子点数加硬币点数的期望,期望为 4,新的事件有12种可能。
    • 公式表达为

    E(x+y) = \sum (x+y)P(x,y) \\(推导过程不要看了 只记结论结论吧,我自机瞎推导的) = \sum (x+y)P(x)P(y) \\ = \sum xP(x)P(y) + \sum yP(x)Py \\ =\sum xP(x)\sum P(y) + \sum yP(y)\sum P(x) \\ = \sum xP(x) + \sum yP(y) \\ = E(x) + E(y) 这个只是写了相互独立的推导,能力有限\\ 对于不独立的也成立

    • E(X,y) = E(x)*E(y) 只有当X,Y 相互独立时成立(记住结论)

    7. 方差

    衡量随机变量的离散情况

    方差也是一种期望,是随机变量偏离期望程度的期望。

    E[x]=μ

    V[x]=E[(x-μ)^2]

    与期望值一样,方差也是固定值。

    方差的另一种计算公式
    V(x) = E(x^2) - E(x)^2
    即 x*2 的期望减去x 期望的平方

    证明如下:
    对于x 已知期望是\mu \\新定义z 分布x-\mu \\ 那么有 E(x-\mu)=E(z) = 0 \\ E(x^2) = E((z+\mu)^2) = E(z^2 + \mu^2+2z\mu)\\ = E(z^2) + E(\mu^2) + E(2z\mu) 期望是线性的,加法可以直接拆分\\ =E((x-\mu)^2) + \mu ^2 + 2\mu E(z)\\ 而E((x-\mu)^2) = V(x) \\ \mu = E(x) \\ E(z) = E(x-\mu) = E(x) - \mu = \mu - \mu = 0 \\ 因此有 E(x^2) = V(x) +E(x)^2

    9.协方差

    协方差用来衡量两个变量的线性相关程度。如果两个变量协方差为0 ,说明他们相互独立

    计算公式为
    Cov(x,y) = E((x-\mu)(y-\nu))
    比如同时抛硬币和掷骰子构成一个新的事件。为了方便计算,假设骰子只有1,2,3 三个点

    抛硬币事件
    \begin {cases} P(x=0) = 0.5\\ P(x=1) = 0.5 \end {cases}
    投骰子

    \begin{cases} P(y=1) = 1/3 \\ P(y=2) = 1/3 \\ P(y=3) = 1/3 \\ \end {cases}
    两个事件的协方差
    Cov(x,y) = E((x-\mu)(y-\nu))=\sum (x-\mu)(y-\nu) P(x)P(y)\\ =(0-0.5)(1-2)*0.5*1/3 + (0-0.5)(1-2)*0.5*1/3 +...+(1-0.5)(3-2)*0.5*1/3\\ =((0-0.5)(1-2)+(0-0.5)(2-2)+(0-0.5)(3-2)+(1-0.5)(1-2)+(1-0.5)(2-2)\\ +(1-0.5)(3-2))(0.5*1/3)=0

    在这里插入图片描述

    (x-μ)与(y-ν)符号相同:协方差为正

    (x-μ)与(y-ν)符号相反:协方差为负

    协方差为正:一方大于期望值,另一方也大于期望值的概率高

    10. 伯努利分布

    伯努利分布(Bernoulli distribution)是单个二值随机变量的分布,由参数p∈[0, 1]控制, p即是随机变量等于1的概率。
    \begin {cases} P(x=1) = p \\ P(x=0) = 1-p \end {cases}
    问题:

    求伯努利分布的期望和方差
    E(x) = 1*p + 0*(1-p) = p\\ V(x) = E(x^2) - (E(x))^2 (伯努利分布平方之后跟原来一摸一样)\\ =p - p^2 = p(1-p) = pq

    11.二项分布

    二项分布(Binomial distribution)表示“硬币正面向上的概率为p时,抛硬币n次后正面向上的次数”。二项分布是伯努利分布的叠加
    x=z_1+z_2+…+z_n

    记作Bn(n, p)

    比如我现在抛七次硬币,单独的一次抛硬币向上的概率为0.6

    0词向上的次数的概率为
    (1-0.6)^7
    第一次向上,其余向下的概率为
    0.6*(1-0.6)^6
    第二次向上,其余向下概率为
    0.6*(1-0.6)^6
    ...

    1 次向上的概率为
    0.6*(1-0.6)^6*7
    2次向上的概率?

    第一次,第二次向上,其余向下的概率
    0.6^2*(1-0.6)^5
    第一次,第三次向上,。。
    0.6^2*(1-0.6)^5
    ...

    第一次向上,其余次数种有一次向上的概率
    0.6^2*(1-0.6)^5 *(6)
    第一次向上,其余次数有一种向上出现次数是6次

    第一次向下,第二次向上,后面次数出现一次向上对应 5次

    一共次数为
    6+5+4+3+2+1
    3次向上概率?

    还是刚才那样,只需要关注可能的次数即可

    (  )  (   )  (   )   (  )   (   )   (   )  (    )
    

    现在要把 3个1 ,4个0 分配到七个括号里,一共会有多少种情况?

    首先我把第一个1 分配到一个括号里

    ( 1 )  (   )  (   )   (  )   (   )   (   )  (    )
    (  )  (  1 )  (   )   (  )   (   )   (   )  (    )
    (  )  (   )  (  1 )   (  )   (   )   (   )  (    )
    ...
    一共7种可能
    

    然后再把剩下的一个1 分配到剩下的六个括号种,一共有6种可能,但是此时会产生重复情况

    比如我把第一个1 放到了 1号,把第二个1 放到了2号

    跟我把第一个1 放到了2号,第二个1 放到了1 号,这两种起始是一种情况

    这六七四十二种情况其实事把 两个 相同的1 作为不同的数字又给排列组合扩展过的,把 1,1 的排列组合衍生为1

    1_1 1_2 , 1_2, 1_1 两种情况 扩大了 2 * 1 倍

    然后我再把第三个一号放入剩下的括号里 ,一共 5种可能,但是还会有重复的,比如针对前三次都是一这种情况,可以是

    第一次放第一个括号,第二次放第二个括号,第三次放第三个括号 (1_1,1_2,1_3)
    也可以是第一次放第一个括号,第二次放第三个括号,第三次放第而个括号 (1_1,1_3,1_2)
    (1_2,1_1,1_3)
    (1_2,1_3,1_1)
    一共有 3*2*1 种可能
    扩大了6倍
    

    因此出现3次向上的概率为
    0.6^3*(1-0.6)^4 *\frac{7*6*5}{3*2*1}\\
    同样扩展到 抛n 次硬币 k次朝上的概率
    0.6^k*(1-0.6) ^ {(n-k)}* \frac{n(n-1)...(n-k+1)}{k!}\\ 而 n(n-1)...(n-k+1) = \frac {nn(n-1)...(n-k+1)(n-k)...1}{(n-k)(n-k-1)...1} \\ = \frac{n!}{(n-k)!}
    最后二项分布概率函数总结为
    P(X=k)=\frac{n!}{(n-k)!k!} p^kq^{n-k}

    二项分布是n个相同的伯努利分布叠加

    期望计算公式为
    E(x) = E(z + z + z + z) = nE(z) = np
    以为每个伯努利分布都是独立的,相互独立的事件方差可以线性相加

    方差计算公式
    V(x) =nV(z) = npq

    12.正态分布

    直接看图吧,这个没啥好解释的

    在这里插入图片描述

    标准正态公式:期望为 0 方差为1
    f(z)=\frac {1}{\sqrt{2\pi}}e^{-\frac{z^2}{2}}

    在这里插入图片描述 在这里插入图片描述

    相关文章

      网友评论

          本文标题:概率笔记1

          本文链接:https://www.haomeiwen.com/subject/vwrlohtx.html