概率和置信区间:
概率:也称几率和机率,是一个在 0 到 1 之间的实数,是对随机事件发生之可能性的度量。
贝叶斯定理:描述的是在已知一些条件下,某事件的发生概率。
A 事件发生的概率,乘以 A 事件下 B 事件发生的概率,这个乘积等于 B 事件发生概率乘以 B 事件下 A 发生的概率 P(A|B)= P(B|A)P(A)/ P(B)通过已知的任意三个概率函数推出第四个
置信区间:是对产生样本的总体参数分布中的某一个未知参数值,以区间形式给出的估计。
数理统计的点估计指标:
描述性统计分析是传统数据分析的基础。这个分析过程可以产生一些描述性指标,比如平均值、中位数、最大值、最小值、百分位数等。这些描述性指标被称为点估计
平均值:是最常用测度值,它的目的是确定一组数据的均衡点。但不足之处是它容易收到极端值影响
中位数:将数值集合划分为相等的上下两部分,一般就是将数据以升序或降序排列后,处于最中间的数。优点是不受极端值影响,但是位置太固定,没有代表性
方差/标准差 描述变量的离散程度,也就是该变量离其期望值的距离
重要的分布模型包含泊松分布、二项式分布和正态分布。
泊松分布:适合于描述单位时间内随机事件发生的次数的概率分布。如某一服务设施在一定时间内收到的服务请求的次数等。当 n 很大,且在一次试验中出现的概率 P 很小时,泊松分布近似二项式分布。
二项分布:是 n 个独立的是 / 非试验中成功的次数的离散概率分布。
正态分布:也叫高斯分布(Gaussian distribution)。经常用来代表一个不明的随机变量。正态分布的曲线呈钟型,两头低,中间高,左右对称,因此经常被称之为钟形曲线
排队的理论:
排队论:也被称为随机服务系统理论。这个理论能帮助我们正确地设计和有效运行各个服务系统,使之发挥最佳效益。排队系统的输出也有很多的参数,比较重要的是排队长度、等待时间、系统负载水平和空闲率等。所有这些输入、输出参数和我们进行的性能测试和优化都息息相关。
我们用的比较多的是单排队排服务台和多队列多服务台
网友评论