美文网首页
大数据中的统计学基础——Day2

大数据中的统计学基础——Day2

作者: XaviSong | 来源:发表于2020-08-21 00:29 被阅读0次

    本章内容

    1. 随机试验、样本空间、样本点、基本事件
    2. 频率与概率
    3. 古典概型
    4. 几何概型

    一、随机试验、样本空间、样本点、随机事件、基本事件

    1、随机试验:
    1. 可以在相同的条件下重复进行
    2. 试验的可能结果不止一个,但在试验前可以知道所有可能结果
    3. 试验前不能确定哪个结果会出现

    对于随机试验E,E的所有可能结果组成的集合称为E的样本空间,记为S。其中,S中的元素,即E的每个可能结果,称为样本点

    一般地,我们称试验E的样本空间S的某个子集为E的随机事件,简称事件。一般用大写字母A,B,C……表示。由一个样本点组成的单点集,称为基本事件。例如,在抛骰子中,“所得点数为偶数”是一个随机事件A,“所得点数为1点”也是一个随机事件,“所得点数是3点”是一个基本事件C。在抛骰子这个试验中,一共有6个基本事件。

    必然事件:在每个试验中一定会发生的事件。抛骰子中,事件D:“点数小亍等于6 点”是必然事件 不可能事件:在每个试验中一定不会发生的事件,用∅ 表示。抛骰子中,事件E:“点数大于6点”是不可能事件。

    2、事件关系
    3、事件运算定律

    二、频率与概率

    频率:在相同的条件下,重复n次试验,事件A发生的次数nA称为A的频数,nA/n称为事件A发生的频率。
    概率:大量的试验证明,当试验的重复次数n逐渐增大时,事件A发生的频率会逐渐稳定于某个常数p。这个p就是事件A发生的概率,用于表示在一次试验中,事件A发生的可能性大小。记事件A的概率为P(A)。

    概率需要满足的条件:

    加法公式:

    三、古典概型

    对于试验E,若满足:

    1. 试验的样本空间只包含有限个元素
    2. 试验中每个基本事件发生的可能性相同,即每个基本事件发生的概率相等

    则称这样的试验E为古典概型,也叫等可能概型
    例子:抛硬币,抛骰子等。

    排列组合:

    排列:从n个不同元素中,任取m个元素,按照一定的顺序排成一列,叫做从n个不同元素中 取出m个元素的一个排列。与顺序有关

    组合:从n个不同元素中,任取m个元素,并成一组,叫做从n个不同元素中取出m个元素的一个组合。与顺序无关

    表示法:

    古典概型题目示例:

    例1:一个口袋装有 6只球,其中4只白球.2只红球.从袋中取球两次,每次随机地取一只考虑两种取球方式:(a)第一次取一只球,观察其颜色后放回袋中,搅匀后再取一球.这种取球方式叫做放回抽样. (b)第一次取一球不放回袋中,第二次从剩余的球中再取一球.这种取球方式叫做不放回抽样.试分别就上面两种情况求

    (1)取到的两只球都是白球的概率;

    (2)取到的两只球颜色相同的概率;

    (3)取到的两只球中至少有一只是白球的概率

    以A、B、C分别表示事件“取到的两只球都是白球”,“取到的两只球都是红球”,“取到的两只球中至少有一只是白球”

    例2:设有N件产品,其中有D件次品,今从中任取n件,问其中恰有k(k<=D)件次品的概率。

    例3:将15名新生随机地平均分配到三个班级中去,这15名新生中有3名是优秀生.问(1)每个班级各分配到一名优秀生的概率是多少? (2) 3名优秀生分配在同一班级的概率是多少?

    “概率很小的事件在一次试验中实际上几乎是不发生的”(称之为实际推断原理)。

    四、几何概型

    对于试验E ,若满足:

    1.试验的样本空间包含无限个元素

    2.试验中每个基本事件发生的可能性相同,即每个基本事件发生的概率相等这样的试验E称为几何概型

    P(A)=构成事件A的区域长度(面积或体积)/实验的全部结果所构成的区域长度(面积或体积)

    举例:
    Buffon投针实验:

    18世纪,布丰提出以下问题:设我们有一个以平行且等距(间距为a)木纹铺成的地板(如右图),现在随意抛一支长度b比木纹之间距离小的针,求针和其中一条木纹相交的概率。

    相关文章

      网友评论

          本文标题:大数据中的统计学基础——Day2

          本文链接:https://www.haomeiwen.com/subject/vnzsjktx.html