自然语言理解(Natural Language Understanding,NLU)是自然语言处理(Natural Language Processing,NLP)的一部分。自然语言理解的应用主要有机器翻译,机器客服以及智能音箱等。自然语言理解就是希望机器像人一样,具备正常人的语言理解能力,由于自然语言在理解上有很多难点,所以 NLU 的表现至今还不如人类。


深度学习方法在各项指标上都超越了之前的方法,获得了更好的结果。其中比较有代表性的工作是卷积神经网络(Convolutional Neural Network,CNN)【1】以及循环神经网络(Recurrent Neural Network,RNN)【2】。CNN虽然在NLP中有所作用,但是NLP并非它擅长的领域,它在计算机视觉领域取得了更为瞩目的成果。相比之下,RNN在设计之初就是被用来处理时序列数据,非常契合NLP的数据结构。在RNN的基础上,近些年来涌现了非常多的自然语言处理模型,且NLU大部分的进展都与模型的进步挂钩。

RNN容易受到短期记忆的影响。如果序列很长,它很难将信息从较早的时间步传送到后面的时间步。因此,如果尝试通过一段文本进行预测,RNN可能会遗漏开头的重要信息。为了解决这个问题,作为RNN分支下的改进版,Long-Short Term Memory(LSTM)【3】和Gated Recurrent Unit(GRU)【4】都利用了门单元结构拓展了RNN每个节点的功能,使得模型在更长的文本距离上有足够的记忆能力。




其中最为著名的架构是Bidirectional Encoder Representation from Transformers(BERT)【7】和Generative Pre-Training(GPT)【8】。BERT几乎适用于各项NLU任务,而GPT主要用于阅读理解、句子或段落生成等任务。

在BERT的基础上,百度提出的ERNIE模型【9】改进了BERT在中文NLP任务中表现不够好的缺陷。在BERT预训练语言模型中,它很少考虑知识信息,即知识图谱。知识图谱能够提供丰富的结构化知识事实,以便进行更好的知识理解。因此清华大学提出了ERNIE【10】来改进BERT在知识驱动型任务上的表现。MASS【11】和UNILM【12】改进了BERT在自然语言生成任务(Natural Language Generation)上的表现。还有SpanBert【13】,RoBERTa【14】,ALBert【15】,Electra【16】和DistillBert【17】都在各个角度对BERT进行了改进。

为了衡量各个模型在NLU任务上的表现,有一个公开的Benchmark,通用语言理解评估基准(General Language Understanding Evaluation ,GLUE)【18】。GLUE Benchmark比赛排名是衡量自然语言理解技术水平的重要指标。比赛设置了自然语言推断、语义相似度、问答匹配、情感分析等9项任务,最后按平均分综合排名。目前GLUE上表现最好的是阿里巴巴的团队所提出的模型StructBERT【19】。


