11统计基础- 计算P值

作者: 不到7不改名 | 来源:发表于2020-12-24 10:57 被阅读0次

计算P值

有两种p值,单侧和双侧。双侧p值是最常见的,重点是计算它们。相反,单侧p值是很少被使用。

p-value由三部分组成:

  • 随机的概率会产生观察结果。

  • 观察到其他同样罕见的事物的概率。

  • 观察到更罕见或更极端事物的概率。

举个例子,我们做掷硬币实验,并提出零假设:即使我连续得到2次正面,我的硬币和普通硬币没有区别。然后我们来计算p值俩检验假设。两次正面朝上的p值等于:两次正面朝上的概率0.25+两次反面朝上的概率0.25+更罕见的概率0=0.5。0.5>0.05,所以我们接受零假设,我的硬币和普通硬币没有区别。

image-20201221155243111.png

再来一个例子,提出零假设:即使我得到4次正面1次个反面,我的硬币和普通硬币没有区别。然后我们来计算p值检验假设。4次正面1次个反面的p值等于:四次正面和一次反面的概率5/32 +四次反面一次正面的概率5/32 +五次正面和五次反面的概率2/32 = 0.375。0.375>0.05,所以我们接受零假设,我的硬币和普通硬币没有区别。

然而,实际上,当我们计算概率p值时对于一些连续的东西,比如高度,我们使用统计分布。下面是1996年15至49岁巴西女性的身高分布

例如,我们测量一个人的身高是142厘米,我们可能会想,这是否来自于这种分布高度,其平均值为155.7cm。或者它来自于另一个高度分布,例如这个绿色分布有一个平均值142cm。 假设:此测量来自蓝色分布。p值=首先是小于等于142厘米的人群的面积0.025+大于等于169厘米的人群的面积为0.025 = 0.05,它可能来自于蓝色分布,也可能不是。很难判断,因为p值刚好在边界上。


image-20201221160830862.png

如果我们测量身高141cm。假设:此测量来自蓝色分布。p值=0.016+0.016=0.03,0.03<0.05,拒绝假设,此侧量可能来自其他分布。


image-20201221162325293.png

如果我们测量身高在155.4cm到156之间。假设:此测量来自蓝色分布。p值=0.04+0.48+0.48=1,接受假设,此测量来自蓝色分布。


image-20201221162910344.png

接下来的例子将证明单侧p值的危险,想象一下,我们测量一群人需要多长时间才能从一种疾病中康复。我们创造了一种新的超级药物,想看看它是否能帮助人们在更短的时间内康复。如果我们给一群人服用超级药物平均恢复时间是4.5天。双侧p值=0.016+0.016=0.03。由于0.03<0.05,双侧p值告诉我们,超级药物是不同的,这表明其它分布能更好地解释数据。对于单侧检验,p值=0.016。

image-20201221163426927.png image-20201221163715766.png

现在,想象一下超级药物并没有那么好,而且平均需要15.5天恢复。双侧p值=0.016+0.016=0.03。换句话说,无论超级药物是否超级并使事情变得更好,或者如果不那么超级并使事情变得更糟,双侧p值都将检测到异常的发生。单侧p值=0.98。由于未能发现超级药物正在使情况变得更糟,单边p值是很棘手的,应该避免,或者只有真正了解自己在做什么的专家才使用。

image-20201221164205294.png

相关文章

  • 11统计基础- 计算P值

    计算P值 有两种p值,单侧和双侧。双侧p值是最常见的,重点是计算它们。相反,单侧p值是很少被使用。 p-value...

  • 01-04 Statistical analysis of ti

    计算全局统计值 计算滚动统计值 计算布林带

  • 10统计基础-P值

    P值 p值是0到1之间的数字,在这个例子中,它量化了我们对药物A与药物B不同的信心程度。p值越接近0,我们就越确信...

  • 12统计基础-P值篡改

    P值篡改 p值篡改是指误用和滥用分析技术,导致被假阳性欺骗。 做大量测试并以假阳性结束被称为多重测试问题(mult...

  • 多重假设检验:Bonferroni 和 FDR

    在进行生物统计学的计算过程中,P值是需要进行校正的。因为P值的阈值是人为规定的,无论是多小的P值,也仅仅能代表结果...

  • ggplot2自定义添加P值

    数据分析中通常都需要对数据进行统计检验,仿佛加个P值就能显得论文数据更加专业一点,本节不介绍如何计算P值,我们来介...

  • 统计基础09:置信区间与p值的计算

    计算置信区间(Confidence Intervals,CI)的方法有很多种,bootstrapping仅仅是其中...

  • P值转化为Padj

    把计算出来的储存成一个数组,然后调用函数计算, 一定是所有p值(要计算的p值集合,不能单独只计算一个p值),因为p...

  • 统计汇总函数

    统计汇总函数 函数含义min()#计算最小值max()#计算最大值sum()#和mean()#计算平均值count...

  • 统计基础27:饱和模型与偏差计算R方与p值

    引言:logistic回归中,我们了解到R2和P值的计算方法。但josh starmer老师指出,广义线性模型中R...

网友评论

    本文标题:11统计基础- 计算P值

    本文链接:https://www.haomeiwen.com/subject/zuxdnktx.html