1.问题描述
某次考试成绩中,20人的考试成绩如下表所示。考试包括50道选择题,每题两分。表格中显示了20人的总成绩和第5题的答题情况。请问第5题与总分的相关程度如何?
学生 | 总分 | 第5题答案 | 学生 | 总分 | 第5题答案 |
---|---|---|---|---|---|
1 | 84 | 对 | 11 | 78 | 对 |
2 | 82 | 错 | 12 | 80 | 错 |
3 | 76 | 错 | 13 | 92 | 对 |
4 | 60 | 错 | 14 | 94 | 对 |
5 | 72 | 错 | 15 | 96 | 对 |
6 | 74 | 错 | 16 | 88 | 对 |
7 | 76 | 错 | 17 | 90 | 对 |
8 | 84 | 对 | 18 | 78 | 错 |
9 | 88 | 对 | 19 | 76 | 错 |
10 | 90 | 对 | 20 | 74 | 错 |
2.源码实现
import scipy.stats as stats
x = [1, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 0, 1, 1, 1, 1, 1, 0, 0, 0]
y = [84, 82, 76, 60, 72, 74, 76, 84, 88, 90, 78, 80, 92, 94, 96, 88, 90, 78, 76, 74]
coef, pvalue = stats.pointbiserialr(x, y)
print('pointbiserialr', coef)
print('pvalue', pvalue)
3.运行及其结果
$ python3 example.py
pointbiserialr 0.784987064117
pvalue 4.14592797349e-05
4.结果分析
在输出结果中,可以看到点二列相关系数约为0.785,可以推断第5题的得分情况与总分有较好的一致性。输出的显著性水平的值很小,表示相关系数具有统计学意义。
网友评论