美文网首页
大数据中的统计学基础——Day5

大数据中的统计学基础——Day5

作者: XaviSong | 来源:发表于2020-08-23 17:09 被阅读0次

本章内容:

  1. 导数与微积分公式
  2. 二维随机变量、联合分布
  3. 多维随机变量、边缘分布
  4. 条件分布
  5. 随机变量之间的独立性

一、导数与微积分公式

分部积分法:

二、二维随机变量、联合分布

一般,设E是一个随机试验,它的样本空间是S={e},设X=X{e}和Y={e}是定义在S上的随机变量,由X与Y构成的向量(X,Y)叫做二维随机向量或是二维随机变量(Twodimensional random vector)

联合分布函数:
1、定义

设(X,Y)是二维随机变量,对于任意实数x,y,二元函数: F(x,y)=P{(X≤x)∪(Y≤y)}=P{X≤x,Y≤y} ,称为二维随机变量(X,Y)的联合分布函数(Joint probability distribution)

2、性质
示例:

设随机变量(X, Y)等可能地取值:(0, 0), (0, 2), (2, 0), (2, 2), 求X, Y的联合分布函数

离散型二维随机变量:

如果二维随机变量(X,Y)全部可能取到的值是有限对或是可列无限对,则称(X,Y) 为离散型的二维随机变量。

连续型二维随机变量:

如果对于二维随机变量(X,Y)的分布函数F(x,y),存在非负可积函数f(x,y)使得对 于任意x,y有

称(X,Y)为连续型的二维随机变量。函数f(x,y)称为二维随机变量(X,Y)的联合概率密度(Joint probability density )

联合分布律:

对于离散型的二维随机变量(X,Y)的所有可能取值为(xi,yi),I,j=1,2,……,称 P{X=xi,Y=yi}=pij,i,j=1,2,…… 为随机变量X和Y的联合分布律( Joint distribution law )

性质:
联合概率密度的性质:
示例:

三、多维随机变量、边缘分布

多维随机变量:

设E是一个随机试验,它的样本空间是S={e},设X1=X1{e},X2={e},……,Xn=Xn{e} 是定义在S上的随机变量,由Xi构成的向量(X1,X2,……,Xn)叫做多维随机向量或是多维随机变量( Multidimensional random vector )

对于任意x1,x2,……,xn,函数F(x1,x2,……,xn)= P{X1≤x1, X2≤x2,……Xn≤xn}称为n维随机变量的分布函数

边缘分布:

在多维随机变量中,将X,Y各自的分布称为边缘分布函数( Marginal distribution ),分别记为

边缘分布律:
边缘概率密度:

对于连续型随机变量(X,Y),它的联合概率密度为f(x,y),则关于X和关于Y的边缘概率密度( Marginal probability density )如下:

边缘分布函数与边缘概率密度的关系:
示例:

四、条件分布

对于离散型二维随机变量:
对于连续型二维随机变量:

引入条件概率密度的概念,对于连续型随机变量(X,Y),其联合概率密度为f(x,y),(X,Y)关于Y的边缘概率密度为 𝑓𝑌(𝑦)。若对固定的y, 𝑓𝑌𝑦 > 0,则称𝑓(𝑥,𝑦) /𝑓𝑌(𝑥) 为在Y=y条件下X的条件概率密度

示例:
各种分布之间的关系:

五、随机变量的独立性

相关文章

  • 大数据中的统计学基础——Day5

    本章内容: 导数与微积分公式 二维随机变量、联合分布 多维随机变量、边缘分布 条件分布 随机变量之间的独立性 一、...

  • 统计

    自选课程-统计学可汗学院统计学 定义 统计学是在数据分析的基础上,研究测定、收集、整理、归纳和分析反映数据数据,以...

  • 读书感想-大数据的工具:R语言实战

    入门书籍。不是大数据入门书籍,而是R语言的入门书籍。 大数据的基础,还是统计学。没有统计学的基础,看这本书,就好像...

  • 如何快速掌握数据分析与数据挖掘?

    做数据分析最重要的还是本身的逻辑能力和是否有统计学的基础。 数据分析师需要什么技能: 数据分析技能、统计学基础、计...

  • 【小火杂谈】描述性统计的深入分析

    描述性统计是:报告数据、不做任何分析,不做任何猜测。 推断统计学:推断统计学建立到样本的基础上,作出推断。定量数据...

  • 聊一聊统计学和数据挖掘的区别(四)

    前几篇文章中我们都是从统计学的角度给大家讲解数据挖掘和统计学的区别所在,但是对于统计学来说,数据挖掘中的核心就是准...

  • 数据分析有哪些好书值得推荐?

    1、统计学书单 如果你打开招聘的职位要求,都会要求具有统计学的知识,这是因为统计学是数据分析、机器学习的基础知识,...

  • 数据挖掘 数据分析

    数据挖掘: 预备基础知识 : 概率论 、线性代数、信息论 、概率论、统计学 。 编程基础 : 数据库 、pytho...

  • 学数据分析要懂的统计学知识

    对于数据分析师来说,我们是必须学习统计学知识的,毕竟天天跟数据打交道,总不能连最基础的统计学知识都不会吧? ...

  • 125、描述统计学基础

    学习数据分析最重要的基础之一是描述统计学,我推荐《深入浅出统计学》这本书,那什么是描述统计学呢? 描述统计学就是将...

网友评论

      本文标题:大数据中的统计学基础——Day5

      本文链接:https://www.haomeiwen.com/subject/bkfwjktx.html