1. 为什么要使用P-value
在统计学中为什么要使用P-value值,statquest用一个非常简单的例子来说明。
例子:比较两种药物治疗的疗效
这种情况下显而易见,药物A的疗效会更好……
但是第二种情景:
image.png
这种情况下,虽然药物A 的治愈率要比B的治愈率要搞,但是我们也很难就此下结论说,A药物的治疗效果确实要比B药物的治疗效果要好。
那么要如何证明A药物要比B药物的治疗效果要好呢,换句话说什么样的统计学方法分辨两种药物之间的区别呢?
这时候就会要用到P-value了。
2. 如何使用P-value判断两者之间有没有区别
P-value是一个介于0-1之间的数。
P-value越趋近于0,我们对两个变量之间有差别的信心就越大。
通常情况下,将阈值设置为0.05
现再用一个例子来说明,将药物A分成两部分进行测试,那么这两部分之间的差别将是随机差异造成的。
我们假设两部分的药物A之间存在差异,计算分成两个部分的药物A之间的P-value为0.9,那么就是说我们测试100次,有90次出现差异的原因是随机误差造成的。
我们在比较药物A与药物B,假设药物A与药物B之间是有差别的。
image.png
P-value=0.24>0.05,因此假设不成立,A与B之间没有区别。
3. 如何计算P-value
计算P-value由三部分组成:
- 所观察到结果的概率
- 同样特殊的情况出现的概率
-
更特殊的情况出现的概率
image.png
for example :
如果投掷硬币时两次都是正面,那么投的硬币是一个特殊的硬币吗?
零假设:是特殊的硬币。
image.png
因此,计算P-value= 0.25+0.25+0=0.5
其中第一个0.25是两面都是正面的概率,第二个0.25是两面都是反面的概率,0是比两面都是正面或者是都是反面更加难出现的概率。
网友评论