美文网首页
说人话的统计学,讲假设检验和p值全网最容易懂的版本

说人话的统计学,讲假设检验和p值全网最容易懂的版本

作者: 美琦miki视觉笔记 | 来源:发表于2020-03-20 10:06 被阅读0次

    我是被那个罩杯外星人笑哭了。之前一直搞不懂假设检验。

    说人话的统计学系列原连载于协和八微信公众号。本文为笔者的学习笔记,每篇文章标题已加入原文超链接。如侵权请告知。拷贝了大部分小枫安的笔记,加了一点自己的记录,为了方便自己看,侵删。

    第 1 章 高屋建瓴看统计

    01 你真的懂p值吗? | 说人话的统计学·协和八

    p值(统计显著性)就是在假定我们希望检验的效应并不存在(即「原假设成立」)的前提下,收集到了与我们所得到的结果相同或更极端的数据的概率。

    p值的判断过程,类似于反证法,区别在于由于随机性的存在,在统计推断中,我们无法像在反证法中一样斩钉截铁地认定原假设是错误的,我们只能根据「小概率事件在一次随机实验中不会发生」的原理做出能否推翻原假设的决策

    p值不是原假设为真的概率,也不是备选假设为假的概率,假设是真的概率是固定的,而p会随着每次样本的变化而变化。

    p值只描述样本与原假设的相悖程度,原假设的真与假是我们以此为根据做出的一个判断。p值并不能描述原假设和备选假设本身为真的概率。

    p值并不能代表你所发现的效应(或差异)的大小

    p值只关心数据与原假设之间有多不一致。但是,如果某种效应或差异存在,p值并不能准确地告诉我们效应的大小,更不能告诉我们这效应是否具有实际意义。

    02 做统计,多少数据才算够?(上)| 说人话的统计学·协和八

    利用统计功效(statistical power)进行数据量的估计,称为功效分析 (power analysis)

    第一类错误原假设其实为真时错误地拒绝了它

    第二类错误原假设其实为假时错误的接受了它

    希腊字母⍺和β来代表犯第一类和第二类错误的概率

    1-β正是统计功效

    统计功效(statistical power)如果我们感兴趣的效应或差异的确存在,在给定的显著性水平的规定下,我们能够正确地拒绝原假设的概率。

    效应的大小ES(即故事中被寻找的东西的大小)

    数据或样本量的多少N(即故事中格格巫找东西的时间)

    如果p值并没有那么小呢?比方说0.25?

    到底是原假设真的正确呢,还是我们手上的数据不够?多少数据才算够?

    话说N年过去了,某位性别不明的地球统治者决定要消灭地球上的男人们。但是怎样找到地球上所有的男人并把他们都消灭呢?这位统治者开发出了一种自动判别武器——

    如果胸小于A罩杯,则杀无赦;如果等于或大于A罩杯,则放过。

    如果用统计学的语言来说,由于武器旨在找出男人放过女人,每当它碰到一个没见过的人时,它就先假设这是个女人(「原假设」),如果这人罩杯太小,那就认为这肯定不是个女人(「推翻原假设」)不是女人那还能是啥?男人呗(「接受备选假设」)。

    腥风血雨过后,结果不难想象:

    绝大部分的男人都不带走一片云彩地离开了这个世界,而绝大部分女人都还在愉快地生活着,然而有些可怜的mm因为胸太小被误杀,有些胸肌发达的gg却因为胸很大而活了下来。

    在这里,武器的判别程序犯了两种错误:

    把一小部分小胸女人当成了男人,也就是在原假设其实为真时错误地拒绝了它,这在统计学中被称为「第一类错误」;弃真。

    把一小撮大胸男人当成了女人,也就是在原假设其实为假时错误地接受了它,这在统计学中被称为「第二类错误」。取伪。

    我们通常用一对希腊字母⍺和β来代表犯第一类和第二类错误的概率。在这个故事里,⍺就是被错杀的女人在所有女人中的比例,而β则是被放过的男人在所有男人中的比例。

    到头来,我们如何知道这个武器有多成功呢?既然原来的目标是消灭男人,我们就看看到底多大比例的男人被干掉了,这个比例就是1-β。我们很快就会看到,这正是统计功效。

    在任何统计学问题上,两类错误都是此消彼长的。

    如果统治者想少犯第二类错误,把大胸男们也一块赶尽杀绝,那么必然会有更多小胸女人中枪;相反,如果统治者想少犯第一类错误,降低罩杯标准,那么男人们逃脱厄运就更容易了。

    统计功效指的就是:如果我们感兴趣的效应或差异的确存在,在给定的显著性水平的规定下,我们能够正确地拒绝原假设的概率。这其实就是不犯第二类错误的概率,因此,统计功效的值可以用1减去β得到,用数学式子表示为

    其中,P表示概率,(拒绝 H0 | H1 为真)表示在备选假设 H1为真的条件下拒绝了原假设H0的事件。

    03 做统计,多少数据才算够?(下)| 说人话的统计学·协和八

    显著性水平⍺

    如果p值小于我们事先规定的

    相关文章

      网友评论

          本文标题:说人话的统计学,讲假设检验和p值全网最容易懂的版本

          本文链接:https://www.haomeiwen.com/subject/vtolyhtx.html