美文网首页
一文说清楚中高考人机评分标准!

一文说清楚中高考人机评分标准!

作者: FreddyHao | 来源:发表于2019-05-21 18:40 被阅读0次

    前两天一个很偶然的机会,带着儿子逛进了科大讯飞的线下店,店员小姐强力向我推荐了一下他们的旗舰产品——讯飞翻译机。她看我带着儿子,就对我说:“国家中高考人机口语考试都是使用科大讯飞的标准,从小拿这个机器练习口语,今后就能得高分”。她无心的这句推销语,对于我来说却觉得十分惊讶。大家都知道,高考可是国考,任何涉及到触碰高考公正性的因素,都会立刻排查,一查到底。人机口语考试在很多地方都占了30 分左右,国家怎么可能把这么重要的考试标准让一家商业公司制定?但从这位推销员的逻辑来看也没有错,很多地区的人机考试确实是使用讯飞的软件,讯飞的算法在决定着你的口语得分,这么说起来,讯飞的标准就是国家的标准。

    但我相信事实没这么简单,我总认为国家不太可能把高考的评判标准让一家公司来控制。带着这个疑问,我搜寻了大量资料(射手理工男的好奇心呀!),终于把整个问题搞清楚了。只能说,有时候一个错误结论的获得往往是因为你只掌握了一半的信息,当你突然看到全局的时候,就会发现之前看起来非常合理的逻辑是多么可笑。

    在开始为大家揭秘以前,我们先搞清一个问题,就是口语考试为什么不直接使用老师人工测评,而要借助人工智能?简单的来说主要是因为教师资源不足。我们举个例子,上海每年有5万左右的高中考生,如果都需要老师来测评的话,将组织大量的老师。而且不同老师评判标准不一致,这也会引起家长的质疑,所以比较合理的方式最少要请两位以上老师对同一位同学进行评判,这又进一步加大了对老师的需求。并且,口语测评是一个重复单调的事情,老师长时间进行测评,自身评判的标准也会不稳定,也就是说每位老师每天还不能让他们评测很长时间,这就更进一步要求有足够多的教师资源。所以大家看出来了,口语测评这件事情非常耗费老师资源,而它又是一个重复单一的工作,这类工作最好交给机器去做。

    那如果使用机器进行测评的话,测评打分的标准从哪里来,是机器自己决定,还是要参考延续老师打分的标准?这个问题是核心问题,如果是机器自己决定标准,那机器背后的公司其实就掌握了国考的标准。如果是要延续老师的打分标准,那么这就和某家人工智能厂商自己的评判标准没关系,人工智能提供商的目标是要尽可能的模拟老师的打分标准。

    对于大部分人来说,之所以能够认可讯飞推销员所说的逻辑,认可讯飞的标准就是国考听说的标准,就是因为大家对正式考试的流程不够熟悉,以为考试分数的评判就是机器阅卷后直接给出的。在这里,我就详细的把中高考听说阅卷流程向大家解释一下:

    口语考试流程.png
    1. 搜集学生录音数据
      口语考试完毕后,系统会自动搜集所有考生的录音数据,保存在U盘,封装在密封袋中,由安保一路护送到教育部门所设定的批卷中心。这种方式防止了通过网络上传所带来的黑客攻击,数据篡改等问题。

    2. 10%的试卷老师人工批改
      所有的录音数据进行入库处理,然后抽样10%的试卷,让老师人工进行打分。并且每份试卷最少要两位以上老师进行打分,对于多位老师打分差异比较大的试卷,会再次请总负责老师进行评定,最终给出分数。

    3. 机器学习
      10% 的试卷已经人工批改后,就开始把这些数据作为标准放到人工智能系统中进行训练,系统会充分学习老师打分的技巧,然后生成打分模型,计算模型的各种参数,最终形成一套与老师打分标准基本一致的打分系统。

    4. 利用生成的打分系统对其他90% 的试卷进行打分
      这套系统是充分学习老师的打分标准生成的,接下来的90%的试卷,就直接使用这套系统进行打分,从而大量减少了老师的工作。

    5. 抽样检查
      最后这步也非常关键,机器对90% 的试卷打分后,老师还要进行抽样检查,直到确保机器是按照老师标准进行打分后,整个阅卷过程才算结束。

    通过以上流程,你应该了解到,正式考试批卷的过程中,人工智能的工作就是要最大化的学习老师批改的标准,然后把它批量应用在其他试卷上。每次正式的中高考,都是要经过这个过程的,各地区批改考卷的老师选择不同的话,机器学习出来的标准都是不一样的。所以这个标准并非是掌握在某家公司手中,而是牢牢掌握在国家手中,这样的过程才能体现出公正原则。

    最后,我想再解答一个大家关注的问题,如果中高考的标准是根据当地批卷老师所制定的标准,那平时训练的时候,应该以什么标准为好呢?其实各大口语测评软件,都是搜集了大量的样本数据,然后根据这些数据训练出了一个综合的标准,这个模型主要是为了帮助学生纠正口音,查漏补缺,并熟悉考试流程。原则上这类人机口语软件都能起到类似效果,因此重点不在于软件,平时训练更多的应该关注内容,看看内容是否是符合当地教学特点,毕竟每个地区的题目类型和难度都不一样,及早熟悉当地题目,对考试还是很有帮助的。

    相信通过以上的分析,大家对人机口考的流程已经了解了,也知道口考的评判标准并不是由某一家公司制定的。整个中高考口语考试,看起来虽然是机器在打分,但机器是在模拟批卷老师的标准,这个过程非常的公正,公开,透明。人机口考中人工智能技术的运用,并非为了替代老师,而是要以老师为标准,帮助老师减少工作量,今后如果再有任何公司声称自己是口语考试标准,并以此向你推销产品,你心里一定要清楚,对方就是在耍流氓。

    相关文章

      网友评论

          本文标题:一文说清楚中高考人机评分标准!

          本文链接:https://www.haomeiwen.com/subject/thhszqtx.html