原始分与标准分-写在浙江高考英语加权赋分事件之后

作者: 刘启辉教书匠 | 来源:发表于2018-12-14 06:11 被阅读1153次

原始分与标准分-写在浙江高考英语加权赋分事件之后
难度-写在浙江高考英语加权赋分事件之后
浙江高考加权赋分事件：新高考改革绝不能走回头路
朋友
诚信、公正，你惹了谁
浙江省政府成立调查组对高考英语加权赋分进行调查
调查结果公布！浙江省教育厅厅长被责令辞职
2018-12-06英语加权赋分，回归原始分
原始分恢复、教育厅厅长免职，浙江公布高考英语“加权赋分”调查结果
测验长度-写在浙江高考英语赋权加分事件之后

我在硕士阶段师从我国权威心理与教育统计测量专家、博士生导师戴海琦教授。所以当浙江高考英语加权赋分事件出来之后，我第一时间在戴老师的学生群里发起了讨论，或许是所学专业的缘故，群里讨论的非常热烈。在此，我无意探讨浙江加权赋分事件，更想谈谈我国大众对考试相关知识缺少了解对公共政策推行的影响。依我之见，应该做一点考试相关理论知识的普及工作，这样才方便政府政策的推行。

经济学上有个说法“劣币驱除良币”，大概的意思就是实际价值较高的“良币”渐渐为人们所储存而离开流通市场，使得实际价值较低的“劣币”充斥市场。“劣币驱除良币”反映在生活中就是，坐公交车时，遵守规则依序排队的人吃亏，反而那些不守规矩，排队时见缝插针、横冲直撞的人占便宜。久而久之，就没有人愿意规规矩矩排队了。

原始分犹如劣币，标准分好比良币。标准分也叫z分数，是一种具有相等单位的地位量数。它是将原始分数与团体的平均分之差除以标准差所得的商数，是以标准差为单位度量原始分数离开其平均数的分数之上多少个标准差，或是在平均数之下多少个标准差。它是一个抽象值，不受原始测量单位的影响，并可接受进一步的统计处理。原始分是考生在接受测验后，按照评分标准对其作答反应直接评出来的分数。原始分反映了考生答对题目的个数，或作答正确的程度。但是，原始分一般不能直接反映出考生间差异状况，不能刻划出考生相互比较后所处的地位，也不能说明考生在其他等值测试上应获得什么样的分值。

原始分的不足之处显而易见，比方说，同一科目的两次考试，如果难度不一样，怎么比较两次考试不同成绩的差异？难度大的83分就一定比难度小的86分差吗？不见得！新高考的英语可以多次考试，不同考试间的难度控制是否能做到一致？难度不一致的话，不同考试间的分数怎么比较？倘若不破这个题，家长和考生就会焦虑，生怕吃亏了，为了规避这种情况出现，那就只能每次都考。而每次都考的话就增加了考生的压力，背离高考改革的初衷。原始分还有一个不足的地方，那就是不同科目之间的原始分数是不能累加的。常识都知道体重和身高不能加起来，因为二者的单位不一致。可是，大家想过吗？数学成绩和英语成绩可以相加吗？二者的单位是一样的吗？倘若数学和英语难度不一致，数学很难，高出他人1分很难，英语简单，高出他人好几分很容易，那么数学的1分价值就比英语1分价值高，二者是不能累加的。而标准分是有相等单位的地位量数，只要将不同学科的原始分转换成标准分，各科的成绩就可以相加了。

然而，就这么一个简单的常识，普及起来是难之又难。山东考生在1998年前后执行过标准分，当时标准分是转换分数，平均数是500，标准差为100。依此算法，假定一个考生的数学成绩高于平均分一个标准差，则其标准分为600分。如果一个考生的数学原始成绩高于平均分四个标准差，则其数学标准分为900分。900分就是当年传说的“满分”，其实不是满分，只是这个考生的原始分高于平均数四个标准差，高于四个标准差相当于10万分之三的人可以获得这个成绩。以今年山东近60万考生记，能获得900分的考生不到18个人。这个人数远低于北大清华在山东的招生人数，所以以平均分上下4个标准差作为全距足够区分考生。这样的设计看起来是不错的，可实际推行起来却遭受大众的攻击，一个是打破了我们习以为常的百分制，二是不明白为啥要这么做，三是与我们已建立的认知习惯相去甚远。

迫于各种舆论压力，最后取消了标准分。原始分与标准分之争，就像秀才遇到兵，好比“劣币驱除良币”。可是国际著名的SAT、TOFEL、GRE等各种考试，都采取标准分计分，懂标准分的人，一看一个考生的成绩就大概知道他的位次，而原始分就无从知晓。国际通用标准分，而我们不采用标准分，交流就会成为障碍，无法和国际接轨。这么好的东西，却推广不下去，最大的阻力在民间，我以为是时候普及考试的相关常识和理论了。