美文网首页
Kolmogorov-Smirnov test (K-S 检验)

Kolmogorov-Smirnov test (K-S 检验)

作者: 风知秋 | 来源:发表于2024-01-14 20:25 被阅读0次

Kolmogorov-Smirnov检验(K-S检验)是一种用于检验两个样本分布是否来自同一总体分布的非参数统计方法。该检验基于样本的累积分布函数(CDF)的差异来进行判断。这检验的原理如下:

假设我们有两个样本,分别来自两个未知分布。我们想要知道这两个样本是否来自同一分布。K-S检验的基本思想是比较两个累积分布函数之间的最大垂直差距。

以下是K-S检验的步骤:

计算累积分布函数(CDF):对每个样本,首先按升序排列数据,然后计算每个数据点的累积百分比。这将得到两个累积分布函数,分别对应两个样本。

计算CDF的差异:对于每个数据点,计算两个样本的累积分布函数之间的垂直差距(绝对值)。这些差距的最大值即为K-S统计量(D)。

计算临界值:K-S检验需要一个临界值,该值与所选的显著性水平(通常是0.05或0.01)和样本大小有关。这个临界值可以从K-S分布表中查得。

判断:比较计算得到的K-S统计量和临界值。如果K-S统计量小于临界值,则我们不能拒绝原假设,即认为两个样本来自同一分布;如果K-S统计量大于临界值,则我们拒绝原假设,认为两个样本来自不同的分布。

总体来说,K-S检验是一种在不需要知道样本分布类型的情况下检验两个样本是否来自同一分布的有用方法。它对于非参数检验和对分布形状不做假设的情况非常有用。

样本 A:3,4,6,8,9,10,11,13,15

样本 B:2,5,7,8,11,12,14,15,16,17

下面是进行K-S检验的步骤:

排序并计算累积分布函数(CDF):

对于样本 A:

对于样本 B:

计算临界值:

以所选的显著性水平(例如,0.05)和样本大小(m和n)为基础查找临界值。在这个例子中,我们可以使用K-S分布表或软件工具来找到临界值。

判断:

比较计算得到的K-S统计量和临界值。如果K-S统计量小于临界值,则不能拒绝原假设,即认为两个样本来自同一分布。如果K-S统计量大于临界值,则拒绝原假设,认为两个样本来自不同的分布。

相关文章

  • Python 统计分析

    1. K-S test 2. 两独立样本t检验 3. 单因素方差分析 4. 相关性检验

  • ks.test报错

    作者在利用R中的ks.test函数进行Kolmogorov-Smirnov检验,验证x是否服从均匀分布时,发现编译...

  • 非参数检验-单样本K-S检验

    K-S检验,是不是感觉似曾相识。没错,就是之前我们检验数据正态性的那个K-S检验。它主要的作用就是检验数据的分布情...

  • 正态分布检验

    1、K-S检验 K-S检验基于累计分布函数,用以检验两个经验分布是否不同或一个经验分布与另一个理想分布是否不同(即...

  • K-S检验

    转载:https://wenku.baidu.com/view/e92e4ea1a36925c52cc58bd63...

  • R 数据可视化 —— Q-Q 图

    前言 检验数据的分布有很多种方法,如卡方检验、K-S 检验等。 而以图形的角度来说,可以使用 Q-Q 图或 P-P...

  • 3、Stata入门---常见的统计操作

    一、T检验【T-test】 t 检验(t test)又称学生t检验(Student t-test)可以说是统计推断...

  • 【统计与检验-4】permutation test

    permutation-test 检验 置换检验(permutation test)是一种非参数检验。 在样本分布...

  • 非参数检验-配对样本的Wilcoxon符号秩和检验

    之前我们学习了单样本的K-S检验常用来检测数据是否满足正态分布,并不是单样本t检验的代替方法。 今天学习的配对样本...

  • ks检验(转)

    Kolmogorov-Smirnov是比较一个频率分布f(x)与理论分布g(x)或者两个观测值分布的检验方法。其原...

网友评论

      本文标题:Kolmogorov-Smirnov test (K-S 检验)

      本文链接:https://www.haomeiwen.com/subject/dnkcodtx.html