1.这里是新手经常出现的问题哈,我们一般做实验,都是有原假设H0和备择假设H1,一般都是H0是组间差异=0,H1是不等于0,所以在不等于0的时候会有差异为正和差异为负两种情况也就是上面图里吐红的两侧,我们计算的p值,其实就是这里红色的面积,而通过scipy.stats.norm.sf(abs(z_scores))这个计算出来的是单侧的面积,是需要乘以2的,(除非我们的备择假设H1是说差异大于或者小于0的其中一种,才是单侧,但是这个在我们的实验中基本不会这样假设)
8bdeeb35-081f-45d8-80be-12116e1a80d8.png2.所以在查表的时候,我们会这样看,自由度(一般就是样本量-1),互联网的样本量都是很大的,所以这里的自由度是无穷大,也就是最下面一行,再看我们的双侧检验,双侧的p值等于0.05时,此时的z值正好的1.96,这个临界值一般时需要记住的哈,也就是说如果z值的绝对值大于1.96,p值就会小于0.05,此时才是显著的
5787a531-579d-4d06-93cd-655d5d3a6f54.png3.代码和函数有很多,平时用的时候,可以用1.96先check一下
网友评论