美文网首页StatQuest学习笔记分享
32统计基础- 分位数和百分位数

32统计基础- 分位数和百分位数

作者: 不到7不改名 | 来源:发表于2021-01-07 11:36 被阅读0次

我们共检测了15个基因的表达。这是中位数,50%的基因表达量较高,50%的基因表达量较低。中位数(median)是分位数(quantile),因为它将数据分成包含相同数量数据的组。有时,这个分位数(中位数)被标记为0.5(因为它把数据分成两半),有时它被标记为50%(因为50%的数据在它上面,50%在它下面)。中位数是4.5,因此50%的分位数是4.5。

中位数是一个分位数,因为它将数据分成大小相等的组。这被称为0.5分位数或50%分位数。无论哪种表示法是“正确的”,您都可能看到它们。

image-20201228131525947.png

现在我们又添加了两条线。连同第一条线,他们把数据分成4个大小相同的组。这些新线是分位数,因为它们将数据分成了同样大小的组。有0.25或25%分位数,因为有四分之一(或25%)的点小于它。0.75或75%分位数,因为四分之三(或75%)的点都小于它。

通常,分位数只是将数据划分为同等大小的组的行。这是定义。从定义上讲,百分位数(percentiles)只是将数据分成100个相同大小的组的分位数。然而,在实践中,这个术语要灵活得多。即使这个数据集不够大,不能分成100个组,我们仍然将中位数(或50%分位数)称为50百分位数。

image-20201228132703177.png

通常,当我们将每个数据点划分到它自己的组时,会使用“分位数”和“百分位数”这两个术语。由于没有任何值小于底部的这个值,所以它被称为0%分位数,或第0个百分位数。

image-20201228132846121.png

到目前为止,我已经向你们展示了一种计算分位数百分位数的方法,然而还有更多的方法。R的quantile()函数提供了9种不同的方法来计算分位数,每一种方法都会产生稍微不同的结果。这意味着,如果你的数据集很小,不要在分位数中存放太多数据,因为它们会在不同方法(和不同样本)之间发生很大变化。然而,当您的数据集很大时,所有的方法都会给出相当相似的结果。

相关文章

  • 32统计基础- 分位数和百分位数

    我们共检测了15个基因的表达。这是中位数,50%的基因表达量较高,50%的基因表达量较低。中位数(median)是...

  • 《数据挖掘导论》CH3探索数据-读书笔记

    3.2数据汇总 频率,众数,百分位数,位置度量(均值和中位数),散布度量(极差和方差),多元汇总统计(相关矩阵) ...

  • 33统计基础- 分位数-分位数图

    我们共检测了15个基因的表达。这个数据是正态分布的吗?Q-Q图有助于回答这个问题。 给每个点一个分位数 得到一条正...

  • 我的R学习札记——箱图简单例子

    箱图主要是用最小值、下四分位数(第25百分位数)、中位数(第50百分位数)、上四分位数(第75百分位数)以及最大值...

  • 4.网络地址,广播地址,子网掩码,IP

    IP地址位数=网络位数+主机位数=32位。子网掩码的位数就是网络的位数 IP地址位数=32 网络位+主机位=32 ...

  • R011 基本图形-箱线图boxplot()

    箱线图(又称盒须图)通过绘制连续型变量的五数总括,即最小值、下四分位数(第25百分位数)、中位数(第50百分位数)...

  • 统计学--2.统计学基础概念

    简述 简述统计学基础概念,均值,异常值,中位数,众数,方差,四分位数,标准分的概念。以及应用和为什么会有这么多概念...

  • 数学分位数

    在统计里面,有 quantile (分位数)的概念从小到大排列其中,median(中位数)也就是二分位数first...

  • matplotlib绘制箱型图、误差棒图、堆积图等图形

    1.箱型图箱型图是由一个箱体和一对箱须所组成的统计图形。箱体由第一四分位数、中位数(第二四分位数)和第三四分位数所...

  • 分位数quantile

    中位数一般化即为分位数,表征顺序排列的一组数中,百分之多少对应的点 如中位数,50%对应的点;1/4分位数,25%...

网友评论

    本文标题:32统计基础- 分位数和百分位数

    本文链接:https://www.haomeiwen.com/subject/jivmoktx.html