美文网首页
编译器笔记13-语法分析-LR分析法概述

编译器笔记13-语法分析-LR分析法概述

作者: 衣忌破 | 来源:发表于2019-11-11 14:05 被阅读0次

一.LR分析法简介

可以用LR分析法分析的文法可以称为LR分析法。LR文法(Knuth,1963)是最大的、可以构造出相应移入- 归约语法分析器的文法类。

  • L: 对输入进行从左到右的扫描
  • R: 反向构造出一个最右推导序列

LR(k)分析,需要向前查看k个输入符号的LR分析,k=0 和 k=1 这两种情况具有实践意义,当省略(k)时,表示k=1。而在LR(k)这样的名称中,k代表的是分析时所需前瞻符号(lookahead symbol)的数量,也就是除了当前处理到的输入符号之外,还得再向右引用几个符号之意;省略 (k)时即视为LR(1),而非LR(0)。

作为对比这里列出LL(1)文法的含义:

  • 第一个“L” 表示从左向右扫描输入
  • 第二个“L” 表示产生最左推导
  • “1” 表示在每一步中只需要向前看一个输入符号来决定语法分析动作

二.LR分析法的基本原理

问:自底向上分析的关键问题是什么?
答:如何正确地识别句柄,句柄是逐步形成的,用“状态”表示句柄识别的进展程度。例如在自底向上分析概述中所提及到句柄识别错误的例子,通过状态跟下一个输入符号就可以判断出应该做出哪一个动作,而状态相当于一种记忆功能记录当前句柄识别到什么程度。

三个状态.png LR分析器(自动机)的总体结构.png

与移入分析器不同的是LR分析器多了一个与符号栈平行的状态栈。

三.分析表的作用

LR分析表的结构.png 分析过程1.png

之后的分析过程与上图类似,直至到如下状态,分析成功。可见分析时进行什么动作是由栈状态栈栈顶的状态和下一个输入符号决定。

分析过程2.png

四.LR分析器的工作过程

LR分析器的工作过程1.png LR分析器的工作过程2.png LR分析器的工作过程3.png

输入:串w和LR语法分析表,该表描述了文法G的ACTION函数和GOTO函数。
输出:如果w在L(G)中,则输出w的自底向上语法分析过程中的归约步骤;否则给出一个错误指示。
方法:初始时,语法分析器栈中的内容为初始状态s0 ,输入缓冲区中的内容为w$。然后,语法分析器执行下面的程序:

程序.png

五.LR(0)分析表构造

相关概念

先了解LR(0)项目和增广文法这两个概念

  • LR(0)项目

右部某位置标有圆点的产生式称为相应文法的一个LR(0)项目(简称为项目):A → α1·α2

文法开始符号S表示的是语言中的最大成分。如下图当b出现时可以将它移入到分析栈中。b移进栈后我们期待归约出B。当归约出B时我们还期待再归约一个B。

LR(0) 项目.png
  • 增广文法 (Augmented Grammar)

如果G是一个以S为开始符号的文法,则G的增广文法G'就是在G中加上新开始符号S'和产生式S'→S而得到的文法

增广文法.png

引入这个新的开始产生式的目的是使得文法开始符号仅出现在一个产生式的左边,从而使得分析器只有一个接受状态。

  • 文法中的项目

项目可以分为以下几类:

  1. 归约项目 - 圆点在生成式最右端,需要归约
  2. 接收项目 - 特殊的归约项目,是文法开始符号的归约项目
  3. 待约项目 - 圆点后面的第一个符号为非终结符
  4. 移进项目 - 圆点后面的第一个符号为终结符
初始项目 归约项目 接收项目.png

上图中S'对应的第一个项目称为初始项目,而S'对应的最后一个项目称之为接收项目在此状态下文法的开始符号已经被归约出来,因此可以接收了故称为接收项目。红色方框中的项目则被称为归约项目。

项目.png
  • 后继项目(Successive Item)
  1. 同属于一个产生式的项目,但圆点的位置只相差一个符号,则称后者是前者的后继项目。
  2. A→α·Xβ的后继项目是A→αX·β

项目集闭包(Closure of Item Sets)

可以把等价的项目组成一个项目集(I),称为项目集闭包,每个项目集闭包对应着自动机的一个状态。

LR(0)分析表构造算法
LR(0)自动机.png

先了解CLOSURE和GOTO这两个函数

  • CLOSURE( )函数

项目集I的闭包的数学定义:

CLOSURE(I) = I ∪ {B → ·γ | A → α·Bβ ∈ CLOSURE(I), B→γ ∈ P}
算法.png
  • GOTO( )函数

返回项目集I对应于文法符号X的后继项目集闭包

GOTO( I, X )=CLOSURE({A→αX·β | A→α·Xβ ∈I })
算法.png
构造LR(0)自动机的状态集

规范LR(0)项集族(Canonical LR(0) Collection)

算法.png
LR(0)分析表构造算法
LR(0)分析表构造算法.png
LR(0) 自动机的形式化定义
自动机的形式化定义.png

说明:该自动机的初始状态就是文法的初始项目的项目集闭包,其终止状态集合只有一个状态就是文法的接收项目的项目集闭包。

六 LR(0)分析的问题

LR(0) 分析过程中的冲突
LR(0)分析过程中的冲突.png
表达式文法的LR(0)分析表含有移进/归约冲突
分析表.png
移进/归约冲突和归约/归约冲突
状态2混合了两种冲突.png

如果LR(0)分析表中没有语法分析动作冲突,那么给定的文法就称为LR(0)。不是所有CFG都能用LR(0)方法进行分析,也就是说,CFG不总是LR(0)文法。

为了解决移进/归约冲突和归约/归约冲突需要使用到SLR分析法LR(1)分析法

问: 为什么没有移进/移进冲突?
答: 首先只有在移进状态和待约状态下的项目才会有使用到移进操作。在0状态时所有项目都是移进状态根据LL文法显然不会产生移进/移进操作,因为每个产生式左部的SELECT集是没有交集的。而在其他具有待约状态项目的状态中,所有集合都是等价的。假若在某状态下输入终结符y时发生移进/移进冲突,即存在两个这样的项目A0→α0·yβ0,A1→α1·yβ1,但显然这两个项目是不等价的显然与同一状态下所有项目等价相矛盾,因此这种移进/移进冲突是不存在的。假若在某状态下输入非终结符X时发生移进/移进冲突,即存在两个这样的项目A0→α0·Xβ0,A1→α1·Xβ1,而A0与A1在同一状态下是等价的则两项目要么是A0→α0·Xβ0与X→.Xβ1(原项目A1变为X,α1变为ε)要么是A1→α1·Xβ1与X→.Xβ0(原项目A0变为X,α0变为ε)。显然X→Xβ0|Xβ1(左递归)是不符合LL文法的因此这种情况也是不可能出现。

综上移进/移进冲突在LR分析下是不存在的。

相关文章

  • 编译器笔记13-语法分析-LR分析法概述

    一.LR分析法简介 可以用LR分析法分析的文法可以称为LR分析法。LR文法(Knuth,1963)是最大的、可以构...

  • 第四章第2节 LR分析法

    LR分析法 LR分析法(Knuth,1963)最大的,可以构造出相应 移入-归约语法分析器的文法类L:对输入进行从...

  • python LR语法编译器

    LR语法分析概述 一.计算识别活前缀 二.计算LR项目集合识别活前缀的DFA 三.判断是不是合法LR(0)文法 四...

  • 第四章 自顶向下的分析

    【语法分析的方法】=【自顶向下】语法分析法+【自底向上】语法分析法 1. 自上而下的分析法:从语法的开始符号出发,...

  • 【MOOC:编译原理】第一章 编译概述

    第一讲 编译器概述 第二讲 编译器结构 编译器具有非常模块化的高层结构 前端:词法分析, 语法分析 后端:指令生成...

  • 编译原理——语法分析(LR语法分析)

    1、LR语法分析算法 LR语法分析器的模型是由输入、输出、栈、驱动程序以及包含动作(action)和转移(goto...

  • 编译器笔记15-语法分析-LR(1)分析

    LR(1)分析法的提出 SLR分析只是简单地考察下一个输入符号b是否属于与归约项目A→α 相关联的FOLLOW(A...

  • 编译器笔记16-语法分析-LALR分析法

    LALR分析法的提出 LR(1)分析法实际上是根据展望符集合的不同将原始的LR(0)项目进行分裂,分裂成不同的LR...

  • 语法分析

    手写语法分析使用递归下降分析法和算符优先分析法。 BNF 语法分析对应上下文无关文法。定义时一般用BNF描述出来。...

  • iOS 编译过程

    iOS 编译采用 Clang 作为编译器前端,LLVM 作为编译器后端,编译器前端负责语法分析,语义分析,生成生成...

网友评论

      本文标题:编译器笔记13-语法分析-LR分析法概述

      本文链接:https://www.haomeiwen.com/subject/xjctictx.html