美文网首页
大数据中的统计学基础——Day2

大数据中的统计学基础——Day2

作者: XaviSong | 来源:发表于2020-08-21 00:29 被阅读0次

本章内容

  1. 随机试验、样本空间、样本点、基本事件
  2. 频率与概率
  3. 古典概型
  4. 几何概型

一、随机试验、样本空间、样本点、随机事件、基本事件

1、随机试验:
  1. 可以在相同的条件下重复进行
  2. 试验的可能结果不止一个,但在试验前可以知道所有可能结果
  3. 试验前不能确定哪个结果会出现

对于随机试验E,E的所有可能结果组成的集合称为E的样本空间,记为S。其中,S中的元素,即E的每个可能结果,称为样本点

一般地,我们称试验E的样本空间S的某个子集为E的随机事件,简称事件。一般用大写字母A,B,C……表示。由一个样本点组成的单点集,称为基本事件。例如,在抛骰子中,“所得点数为偶数”是一个随机事件A,“所得点数为1点”也是一个随机事件,“所得点数是3点”是一个基本事件C。在抛骰子这个试验中,一共有6个基本事件。

必然事件:在每个试验中一定会发生的事件。抛骰子中,事件D:“点数小亍等于6 点”是必然事件 不可能事件:在每个试验中一定不会发生的事件,用∅ 表示。抛骰子中,事件E:“点数大于6点”是不可能事件。

2、事件关系
3、事件运算定律

二、频率与概率

频率:在相同的条件下,重复n次试验,事件A发生的次数nA称为A的频数,nA/n称为事件A发生的频率。
概率:大量的试验证明,当试验的重复次数n逐渐增大时,事件A发生的频率会逐渐稳定于某个常数p。这个p就是事件A发生的概率,用于表示在一次试验中,事件A发生的可能性大小。记事件A的概率为P(A)。

概率需要满足的条件:

加法公式:

三、古典概型

对于试验E,若满足:

  1. 试验的样本空间只包含有限个元素
  2. 试验中每个基本事件发生的可能性相同,即每个基本事件发生的概率相等

则称这样的试验E为古典概型,也叫等可能概型
例子:抛硬币,抛骰子等。

排列组合:

排列:从n个不同元素中,任取m个元素,按照一定的顺序排成一列,叫做从n个不同元素中 取出m个元素的一个排列。与顺序有关

组合:从n个不同元素中,任取m个元素,并成一组,叫做从n个不同元素中取出m个元素的一个组合。与顺序无关

表示法:

古典概型题目示例:

例1:一个口袋装有 6只球,其中4只白球.2只红球.从袋中取球两次,每次随机地取一只考虑两种取球方式:(a)第一次取一只球,观察其颜色后放回袋中,搅匀后再取一球.这种取球方式叫做放回抽样. (b)第一次取一球不放回袋中,第二次从剩余的球中再取一球.这种取球方式叫做不放回抽样.试分别就上面两种情况求

(1)取到的两只球都是白球的概率;

(2)取到的两只球颜色相同的概率;

(3)取到的两只球中至少有一只是白球的概率

以A、B、C分别表示事件“取到的两只球都是白球”,“取到的两只球都是红球”,“取到的两只球中至少有一只是白球”

例2:设有N件产品,其中有D件次品,今从中任取n件,问其中恰有k(k<=D)件次品的概率。

例3:将15名新生随机地平均分配到三个班级中去,这15名新生中有3名是优秀生.问(1)每个班级各分配到一名优秀生的概率是多少? (2) 3名优秀生分配在同一班级的概率是多少?

“概率很小的事件在一次试验中实际上几乎是不发生的”(称之为实际推断原理)。

四、几何概型

对于试验E ,若满足:

1.试验的样本空间包含无限个元素

2.试验中每个基本事件发生的可能性相同,即每个基本事件发生的概率相等这样的试验E称为几何概型

P(A)=构成事件A的区域长度(面积或体积)/实验的全部结果所构成的区域长度(面积或体积)

举例:
Buffon投针实验:

18世纪,布丰提出以下问题:设我们有一个以平行且等距(间距为a)木纹铺成的地板(如右图),现在随意抛一支长度b比木纹之间距离小的针,求针和其中一条木纹相交的概率。

相关文章

  • 大数据中的统计学基础——Day2

    本章内容 随机试验、样本空间、样本点、基本事件 频率与概率 古典概型 几何概型 一、随机试验、样本空间、样本点、随...

  • 统计

    自选课程-统计学可汗学院统计学 定义 统计学是在数据分析的基础上,研究测定、收集、整理、归纳和分析反映数据数据,以...

  • 读书感想-大数据的工具:R语言实战

    入门书籍。不是大数据入门书籍,而是R语言的入门书籍。 大数据的基础,还是统计学。没有统计学的基础,看这本书,就好像...

  • 如何快速掌握数据分析与数据挖掘?

    做数据分析最重要的还是本身的逻辑能力和是否有统计学的基础。 数据分析师需要什么技能: 数据分析技能、统计学基础、计...

  • 【小火杂谈】描述性统计的深入分析

    描述性统计是:报告数据、不做任何分析,不做任何猜测。 推断统计学:推断统计学建立到样本的基础上,作出推断。定量数据...

  • 聊一聊统计学和数据挖掘的区别(四)

    前几篇文章中我们都是从统计学的角度给大家讲解数据挖掘和统计学的区别所在,但是对于统计学来说,数据挖掘中的核心就是准...

  • 数据分析有哪些好书值得推荐?

    1、统计学书单 如果你打开招聘的职位要求,都会要求具有统计学的知识,这是因为统计学是数据分析、机器学习的基础知识,...

  • 数据挖掘 数据分析

    数据挖掘: 预备基础知识 : 概率论 、线性代数、信息论 、概率论、统计学 。 编程基础 : 数据库 、pytho...

  • 学数据分析要懂的统计学知识

    对于数据分析师来说,我们是必须学习统计学知识的,毕竟天天跟数据打交道,总不能连最基础的统计学知识都不会吧? ...

  • 125、描述统计学基础

    学习数据分析最重要的基础之一是描述统计学,我推荐《深入浅出统计学》这本书,那什么是描述统计学呢? 描述统计学就是将...

网友评论

      本文标题:大数据中的统计学基础——Day2

      本文链接:https://www.haomeiwen.com/subject/vnzsjktx.html