美文网首页商业分析
概率分布与数据建模

概率分布与数据建模

作者: dreamhappy2009 | 来源:发表于2017-01-12 14:43 被阅读0次

一、概率的基本概念

概率的规则与公式

事件:来自某个样本空间中一个或多个结果的集合。

条件概率:已知事件B为真实或者事件B发生的条件下,事件A发生的概率。

二、随机变量和概率分布

离散的随机变量:可以计数的可能的结果的数字

连续的随机变量:连续的随机变量拥有的结果,处在实数的一个或多个连续区间之中。

三、离散的概率分布概率

质量函数f(x)

累积分布函数F(x)

离散随机变量的期望值E(x)

在决策中使用期望值离散随机变量的方差Var(X)

伯努利分布:一种离散分布,有两种可能的结果。1表示成功,出现的概率为p,其中0<p<1;0表示失败,出现的概率为q=1-p。

期望:E(X)=p。

方差:var(X)=p(1-p)。

二项式分布(Binomial Distribution):,即重复n次的伯努利试验(Bernoulli Experiment),用ξ表示随机试验的结果。记做:ξ~B(n,p)

期望:Eξ=np

方差:Dξ=npq    其中q=1-p

泊松分布:参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。

期望:λ

方差:λ

四、连续概率分布

概率密度函数的性质:

1、f(x)>=0.

2、概率之和为1

3、p(X=x)=0

4、只能在区间上定义连续随机变量的概率。

5、p(a<=X<=b)就是a和b与密度函数之间的面积。

均匀分布:

(1) 如果,则称X服从离散的均匀分布。

(2) 设连续型随机变量X的概率密度函数为则称随机变量X服从[a,b]上的均匀分布,记为X~U(a,b)。

期望:    即数学期望位于区间(a,b)的中间。

方差:

密度函数:

累积分布函数:

正态分布

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。

其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。

当μ = 0,σ = 1时的正态分布是标准正态分布。

函数NORM.INV

标准正态分布

期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。

指数分布:即每单位时间内发生某事件的次数。指数分布的区间是[0,∞)。 如果一个随机变量X呈指数分布,则可以写作:X~ E(λ)。

期望值:1/λ

方差:(1/λ)^2

连续分布:对数正态分布、贝塔分布

五、从概率分布中随机抽样

从离散概率分布中抽样:

从常见的概率分布中抽样

Risk Solver Platform分布函

六、数据建模和分布拟合

拟合优度

用Risk Solver Platform进行分布

拟合

相关文章

  • 概率分布与数据建模

    1、二项分布:模拟n次独立实验,每次试验成功的概率是P。BINOM.DIST(x,,n,p)2、泊松分布:在一定时...

  • 概率分布与数据建模

    一、概率的基本概念 概率的规则与公式 事件:来自某个样本空间中一个或多个结果的集合。 条件概率:已知事件B为真实或...

  • 常用概率分布回顾之(1)离散概率分布

    概率分布的选择取决于建模数据的类型和定义域,描述数据类型为离散值的概率分布即为本章所回顾的离散概率分布。本章主要回...

  • 11.2 项目风险管理

    实施定量风险分析 定性与定量的对比说明 工具与技术 数据收集与展示技术①通过访谈收集②概率分布 定量风险分析和建模...

  • Beta 分布

    关于beta的函数图像描述 Beta 分布是对成功的概率进行建模,而二项分布是对成功的次数进行建模。 PDF是概率...

  • 半监督学习算法(2)-- 半监督高斯混合模型

    生成式方法(generative methods)是对后验概率建模,从统计的角度表示数据的分布情况,能够反映同类数...

  • 万字干货|逻辑回归最详尽解释

    模型介绍 直接对分类的概率建模,无需实现假设数据分布,从而避免了假设分布不准确带来的问题; 不仅可预测出类别,还能...

  • 第一章 算法基础——概率论与数理统计基础

    1.3 概率论与数理统计基础 算法常涉及数据分布情况,而这些分布又与概率紧密相连,常见的分布方式包括二项分布、超几...

  • 朴素贝叶斯估计

    朴素贝叶斯法通过训练数据集学习联合概率分布P(X,Y),具体做法是学习先验概率分布P(Y)与条件概率分布P(X|Y...

  • 机器学习笔记01——数据EDA(探索性数据分析)入门

    知识点 数据属性分布分析(概率密度分析/是否呈现正态分布) 数据属性与Target之间的相关性(correlati...

网友评论

    本文标题:概率分布与数据建模

    本文链接:https://www.haomeiwen.com/subject/ukghbttx.html