异常值总是要么极大,要么极小,四分位距将异常指统统铲除。
平均数:指出数据的中心。
image.png
百分位数:将数据一分为百。对于划分档次非常有用。
箱线图:能在同一张图上体现多个距和四分位数,是在这方面十分有用的一种方法。‘箱’显示出四分位数和四分位距的位置。‘线’则显示出上、下界。箱线图能在一张图上体现多批数据,因此非常有利于比较。
方差:量度数据分散性的一种方法,是数值与均值的距离的平方数的平均值。
image.png
标准差:度量与均值的距离,量度数据的分散性。,体现数值的变异度。
标准份分:利用均值和标准差,将一个数据集中的各个数值转化为更通用的分布形态,同时确保数据的基本形状不变。
概率空间:样本空间,是表示所有可能结果的一种简便表示法。可能发生的事件都是S的子集。
A与B为对立事件:P(A)=1-P(B)
B发生的条件下A发生的概率: P(A|B)=P(AB)/P(B)
image.png
image.png
什么时候使用贝叶斯定理?
答:在需要求出条件概率,且该条件概率与已知条件概率顺序相反时使用。(过滤垃圾邮件,医学实验上)
image.png
image.png
image.png
image.png
image.png
image.png
image.png
作者:至极L
链接:https://www.jianshu.com/p/0b370f51f21c
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
网友评论