美文网首页
说人话的统计学,讲假设检验和p值全网最容易懂的版本

说人话的统计学,讲假设检验和p值全网最容易懂的版本

作者: 美琦miki视觉笔记 | 来源:发表于2020-03-20 10:06 被阅读0次

我是被那个罩杯外星人笑哭了。之前一直搞不懂假设检验。

说人话的统计学系列原连载于协和八微信公众号。本文为笔者的学习笔记,每篇文章标题已加入原文超链接。如侵权请告知。拷贝了大部分小枫安的笔记,加了一点自己的记录,为了方便自己看,侵删。

第 1 章 高屋建瓴看统计

01 你真的懂p值吗? | 说人话的统计学·协和八

p值(统计显著性)就是在假定我们希望检验的效应并不存在(即「原假设成立」)的前提下,收集到了与我们所得到的结果相同或更极端的数据的概率。

p值的判断过程,类似于反证法,区别在于由于随机性的存在,在统计推断中,我们无法像在反证法中一样斩钉截铁地认定原假设是错误的,我们只能根据「小概率事件在一次随机实验中不会发生」的原理做出能否推翻原假设的决策

p值不是原假设为真的概率,也不是备选假设为假的概率,假设是真的概率是固定的,而p会随着每次样本的变化而变化。

p值只描述样本与原假设的相悖程度,原假设的真与假是我们以此为根据做出的一个判断。p值并不能描述原假设和备选假设本身为真的概率。

p值并不能代表你所发现的效应(或差异)的大小

p值只关心数据与原假设之间有多不一致。但是,如果某种效应或差异存在,p值并不能准确地告诉我们效应的大小,更不能告诉我们这效应是否具有实际意义。

02 做统计,多少数据才算够?(上)| 说人话的统计学·协和八

利用统计功效(statistical power)进行数据量的估计,称为功效分析 (power analysis)

第一类错误原假设其实为真时错误地拒绝了它

第二类错误原假设其实为假时错误的接受了它

希腊字母⍺和β来代表犯第一类和第二类错误的概率

1-β正是统计功效

统计功效(statistical power)如果我们感兴趣的效应或差异的确存在,在给定的显著性水平的规定下,我们能够正确地拒绝原假设的概率。

效应的大小ES(即故事中被寻找的东西的大小)

数据或样本量的多少N(即故事中格格巫找东西的时间)

如果p值并没有那么小呢?比方说0.25?

到底是原假设真的正确呢,还是我们手上的数据不够?多少数据才算够?

话说N年过去了,某位性别不明的地球统治者决定要消灭地球上的男人们。但是怎样找到地球上所有的男人并把他们都消灭呢?这位统治者开发出了一种自动判别武器——

如果胸小于A罩杯,则杀无赦;如果等于或大于A罩杯,则放过。

如果用统计学的语言来说,由于武器旨在找出男人放过女人,每当它碰到一个没见过的人时,它就先假设这是个女人(「原假设」),如果这人罩杯太小,那就认为这肯定不是个女人(「推翻原假设」)不是女人那还能是啥?男人呗(「接受备选假设」)。

腥风血雨过后,结果不难想象:

绝大部分的男人都不带走一片云彩地离开了这个世界,而绝大部分女人都还在愉快地生活着,然而有些可怜的mm因为胸太小被误杀,有些胸肌发达的gg却因为胸很大而活了下来。

在这里,武器的判别程序犯了两种错误:

把一小部分小胸女人当成了男人,也就是在原假设其实为真时错误地拒绝了它,这在统计学中被称为「第一类错误」;弃真。

把一小撮大胸男人当成了女人,也就是在原假设其实为假时错误地接受了它,这在统计学中被称为「第二类错误」。取伪。

我们通常用一对希腊字母⍺和β来代表犯第一类和第二类错误的概率。在这个故事里,⍺就是被错杀的女人在所有女人中的比例,而β则是被放过的男人在所有男人中的比例。

到头来,我们如何知道这个武器有多成功呢?既然原来的目标是消灭男人,我们就看看到底多大比例的男人被干掉了,这个比例就是1-β。我们很快就会看到,这正是统计功效。

在任何统计学问题上,两类错误都是此消彼长的。

如果统治者想少犯第二类错误,把大胸男们也一块赶尽杀绝,那么必然会有更多小胸女人中枪;相反,如果统治者想少犯第一类错误,降低罩杯标准,那么男人们逃脱厄运就更容易了。

统计功效指的就是:如果我们感兴趣的效应或差异的确存在,在给定的显著性水平的规定下,我们能够正确地拒绝原假设的概率。这其实就是不犯第二类错误的概率,因此,统计功效的值可以用1减去β得到,用数学式子表示为

其中,P表示概率,(拒绝 H0 | H1 为真)表示在备选假设 H1为真的条件下拒绝了原假设H0的事件。

03 做统计,多少数据才算够?(下)| 说人话的统计学·协和八

显著性水平⍺

如果p值小于我们事先规定的

相关文章

  • 说人话的统计学,讲假设检验和p值全网最容易懂的版本

    我是被那个罩杯外星人笑哭了。之前一直搞不懂假设检验。 说人话的统计学系列原连载于协和八微信公众号。本文为笔者的学习...

  • 统计学中的P/F/T

    我们常常在统计学应用中看到P值,F值,T值,这些参数是什么?我想应该先讲讲“假设检验”,弄明白假设检验,很多问题就...

  • 统计学笔记6 假设检验和p值

    假设检验 假设检验(hypothesis testing),又称统计假设检验,是用来判断样本与样本、样本与总体的差...

  • 假设检验和P值

    举个例子:给100只小鼠注射药物,结果分为:有作用和没作用这个例子中,零假设:没作用备择假设:有作用P值:零假设成...

  • 如何做推论统计分析报告?

    看本文内容前,确保你已经学过之前文章中的“假设检验”: 如何用最通俗易懂的方式理解假设检验 前面我们通过《假设检验...

  • 5 局部错误发现率

    经典单case假设检验基于对统计量(p值)尾部的解释。二战后,多重检验继续基于p值,并扩展到大规模假设检验,前面3...

  • 统计检验 2020-05-07

    假设检验 碰巧有机会回顾了一下统计学的东西,就把一些统计检验相关的放在这了~ 第 3 章 假设检验 | 数理统计讲...

  • 3 显著性检验

    3.1 p值和z值 一般性假设检验构建拒绝域使得对应的p值为: ( 是根据显著性水平 构建的,而显著的 则根据包含...

  • 2019-02-19 第一章:简介

    1.1假设检验,估计和预测 统计学包括了对其它领域研究的设计、假设检验、估计和预测等方面。本书着重讲述估计和预测,...

  • 假设检验 p-value,FDR,q-value

    1、p-value 单个假设检验中主要依靠p值(或统计量t)做出是否拒绝零假设H0的决定:p-value和预先设定...

网友评论

      本文标题:说人话的统计学,讲假设检验和p值全网最容易懂的版本

      本文链接:https://www.haomeiwen.com/subject/vtolyhtx.html