英文机器语法检测

作者: Manchild | 来源:发表于2014-03-02 19:38 被阅读528次

    每当看有人晒老外的中文作业,都不由得为自己的英文写作捏了一把汗。我个人感觉要达到语法正确这个最为起码的标准其实越到后来越不容易,特别是写作的篇幅越来越长,又想刻意使用一些出彩的表达。当然不用说,最好的解决办法当然是找一位英语母语的同学辅导了。本科的时候比较幸运的有一位美国老师,特别热心读我写的东西。但人家好歹也是本应该拿退休工资的人了,只是不甘寂寞才来系里教书。一旦离开了那个环境,想要获得类似的帮助对我来说非常困难。一来自己脸皮薄,拉不下面子去麻烦同学。说实话都到研究生了,谁不是乱七八糟的事情一大堆。即使别人答应帮你一次两次,你也不好意思一提笔就找别人帮忙吧。二来就是即便是让人改了你也不放心。如果想要修改达到预期的目的,我觉得起码你要时间和精力跟你麻烦的人坐在一起一句一句读吧。因为文章有一些语言上的问题,也有一些表达和理解上的问题。如果修改的人没办法跟作者有这个层面上的沟通,我很难保证修改的人不会因为诸多不确定的因素,要么忽视一部分问题,要么自作主张改变原文的意义或者风格。

    好吧,废话已经说了太多。本着求人不如求己的原则,我从上个月开始尝试了一部分机器语法检验的工具协助写作。我个人感觉,其实大多数的在线语法检测工具质量堪忧。我没有一个一个检测过,但其实可想而知。语言太精妙,罗伯特怎么能够靠得住?而且有人说了,死板的语法规则往往会影响语言写作的力度和个性风格。高中老师只会教 And 和 But 不能作为单句开头,一个句子也不能缺少完整的主谓成分,但其实大部职业作家都这么写,既有力度又有风格。确实是这样的没错,但其一:写中文你又不是鲁迅,写英文你又不是哈金,咱们还是得遵循点语言的常规吧?其二:不要忘了使用机器做语法检测的原则,跟使用机器翻译的原则类似,是用来协助效率,而非把关质量的。

    其实机器语法检测大家都很熟悉了,比如抱怨不能再多的Word。一般来说,它除了拼写自动更正的功能有点实用价值之外,那些满屏幕的红线、绿线除了晃花你的眼睛之外有别的功能么(有时候连自动更正,特别是首字母自动大写也够烦人的)?特别是有强迫症的朋友,请练习好如何点击“忽略本次”。另外,其实大部分的语法检测工具远远不止语法、拼写检测的功能。他们至少会提供同义词替换、风格检测、抄袭检测等等Word具备的功能。所以,本文大致介绍几种在线的语法检测工具在提高文本质量上的功能。

    为了配合说明,我需要选取一段测试文本。理想的状况是使用漏洞比较残缺的初稿进行检测,但我实在没有留着文章初稿的癖好,而且都说了脸皮薄也不好意思拿出来现眼,况且各个网站都有千疮百孔的教学案例提供参考。所以,我就在这里就贴个跟另位同事合办的一场学术活动的主题简介。绝对不是千疮百孔的初稿,甚至可以说已经润色到完全可以接受的程度了,但文章里也是有一些问题的(我选取的段落也稍微长一些,否则就真检测不出什么问题了)。我在这里也就借此说明各种工具的特点,具体到个人不同的需求,还是需要大家自己拿一篇文段来试用。

    检测文本:

    From the Werther Effect, a copycat suicide trend following the publication of Goethe's Young Werther, to Bloomsday, when fans retrace Leopold Bloom's route through the Dublin of Ulysses, novels have punctured boundaries between aesthetic experience and the real. But how do films differ from the patterns of words and thoughts that constitute novels? And in what way do those rhetorical and formal differences structure an alternative boundary line separating fantasy, fiction, and narrative from the real world? In his description of the first projection of the Lumière brother’s L'arrivée d'un train à La Ciotat, George Reyes calls “cinema” “the panic and triumph of our age,” citing audience reactions: “Suddenly a train appeared. Women cried out with terror. Men threw themselves to one side to avoid being run over.” Even after a century, we cannot claim to understand completely the distinction between film aesthetics and the real. Although cinema is a clear triumph of technology, art, and capitalist industry, we remain confused, even panicked, about how exactly cinema changes our world and ourselves. We still ask the question, what is the real and what makes us believe in a sense of reality?

    一 Grammarly: www.grammarly.com

    Grammarly 其实是我接触到的第一个语法检测工具,它其实有很明显的优势了,大篇幅处理、风格转换、母语设定、同义词更改功能、抄袭检测等等功能,非常全面。我估计它的算法和规则太多,所以很多时候喜欢抓一些不算是问题的问题。我选择学术模式,同时打开抄袭检测的功能得到以下的报告:

    在学术环境下,它对连词不能作为单句的开头、第一人称避免使用、被动语态等等规则还是非常敏感,这点我其实比较反感。但如果仔细读它每次生成的报告,每个疑似错误的地方都还是比较准确的。它的同义词替换也非常全面,只需要点击某个单词,几乎可以实现任意单词的同义替换。我在这里就展示一下它的界面了。

    二 Ginger:www.gingersoftware.com

    第二个工具 Ginger,支持的媒体和平台比较多样,可以把它内置到Office软件中,也可以通过浏览器插件实现同步检测的功能。也就是说,我可以一边写邮件,一边让Ginger告诉我哪句话犯了语法和拼写错误。Ginger 提供所谓私人教练模式会收集你的错误数据,并分析总结。我个人感觉,它对于基本语法错误的检验还是令人满意的,特别是对于介词搭配这个至少让我头痛的这个问题上颇有帮助。况且它的检测功能是同时的,非常适合撰写邮件等需要效率的事务性工作。但是,对于复杂的文本,比如我上面的检测文本,Ginger基本什么问题都没看出来。不过这也确实难为它了,因为检测文段基本也没有致命的语法错误。

    另外,它的“句子改写”(Sentence Rephraser)也是我见过同类检测工具中比较好的。只不过美中不足的是它只能支持一句一句的改写,并且它给出的改写建议也需要斟酌。我在写一篇活动报告时候使用过一次,我的原文是:

    Having a very constructive session at the beginning of our film series, we wait for the same good conversations in the coming sessions.

    自动改写后的结果是:

    Possessing a very constructive session at the beginning of our film series, we await the same good conversations in the upcoming sessions.

    改得地方不多,但是我还算比较满意吧。除了第一个 possessing 之外,貌似顺眼了一些。

    三 Paper Rater: www.paperrater.com

    这个工具本来是用作机器评分的,使用者可以选择不同的学术等级进行评测。嗯,想必考过GRE的同学都知道,其实ETS早就开始借助机器给GRE作文打分了,大致也不过借助这些规则。我觉得,Paper Rater比较有意思的地方在于它的技术统计吧。它在抄袭、拼写、语法、词汇、风格方面各有各的评分标准。比如词汇小项,它会统计你的高级词汇占总篇幅的比重,在风格小项会统计你句子的平均长度,以及长短句的比例是否平衡等等。不过都是些这么宏观的数据,就算知道了问题你也不知道怎么改。而且,它的抄袭检测完全不能跟Grammarly相提并论。所以,这个工具拿来备战考试吧,我想不出还能拿来干嘛了。

    相关文章

      网友评论

      本文标题:英文机器语法检测

      本文链接:https://www.haomeiwen.com/subject/ebbhtttx.html