1.概念
统计学术语,如果将一组数据从小到大排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。可表示为:一组n个观测值按数值大小排列如,处于p%位置的值称第p百分位数。
比如,中位数就是第50百分位数,第25百分位数又称第一个四分位数(First Quartile),较小四分位数,用Q1表示;第50百分位数又称第二个四分位数(Second Quartile),用Q2表示;第75百分位数又称第三个四分位数(Third Quartile),较大四分位数,用Q3表示。若求得第p百分位数为小数,可完整为整数。第三四分位数与第一四分位数的差距又称四分位距(InterQuartile Range,IQR)第p百分位数是这样一个值,它使得至少有p%的数据项小于或等于这个值,且至少有(100-p)%的数据项大于或等于这个值
2.计算过程
数字按从小到大排序,主要选择四分位的百分比值,及样本总量有以下数学公式可以表示:
- 如果是一个整数,则取第 和 第的平均值
- 如果不是一个整数,则取下一个最近的整数。(比如 = 1.2,则取2)
3.例子
高等院校的入学考试成绩经常以百分位数的形式报告。比如,假设某个考生在入学考试中的语文部分的原始分数为54分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数54分恰好对应的是第70百分位数,我们就能知道大约70%的学生的考分比他低,而约30%的学生考分比他高。
假如:有10个数:1、2、3、4、5、6、7、8、9、10 按由小到大将其排列。求它的第90%百分位,也就是第9个数刚好是9 ,那么90%分位数就是9 。例子来自我是攻城狮
4.箱线图
箱线图就是四分位数的可视化表现
boxplot.jpg
所以通过这个图可以看到一组数据的分布状态。
网友评论