编译器笔记16-语法分析-LALR分析法

作者: 衣忌破 | 来源:发表于2019-11-24 18:15 被阅读0次

编译器笔记16-语法分析-LALR分析法
第四章自顶向下的分析
语法分析
第四章第6节 LALR分析法
编译器笔记13-语法分析-LR分析法概述
二. 初识Bison：写一个简单计算器
iOS 编译过程
第四章第2节 LR分析法
精读《手写 SQL 编译器 - 回溯》
JavaScript运行机制

LALR分析法的提出

LR(1)分析法实际上是根据展望符集合的不同将原始的LR(0)项目进行分裂，分裂成不同的LR(1)项目。这就使得LR(1)的状态数较LR(0)的状态数多了很多。比如说C语言的语法在构造其LR(0)分析表的时候通常只有几百个状态，而构造其LR(1)语法的时候会有几千个状态。为了使LR(1)实用化，必须要想办法去减少其状态数。

LALR分析法的提出.png

如上图有4对同心项目集，I4与I11，I7与I13，I8与I10，I5与I12，把没有状态冲突的项目进行合并可以大大减少自动机的状态数，空间上会更节省。这就是LALR分析法的基本思想。

LALR( lookahead-LR)分析的基本思想

寻找具有相同核心的LR (1) 项集，并将这些项集合并为一个项集。所谓项集的核心就是其第一分量的集合。
然后根据合并后得到的项集族构造语法分析表
如果分析表中没有语法分析动作冲突，给定的文法就称为LALR(1)文法，就可以根据该分析表进行语法分析。

合并同心项集

合并同心项集1.png

合并同心项目集2.png

当第一次了解到合并同心项目这样的操作时，可能会产生这样的疑问，如上图中将I4与I11合并，合并后加入从状态6进入状态4后遇到下一个输入符号为=时逻辑上应该是要报错的，但如果按照合并后的LALR可以看出I4状态下遇上=也会进行归约操作。这种情况其实就设计到LALR的延迟处理下文将会有提及。

合并同心项集时产生归约-归约冲突的例子

归约-归约冲突.png

状态6与状态9是一对同心项目集，即它们的LR(0)项目是相同的。但这两个状态合并会发生归约-归约冲突，合并后当遇到d时无法判断c该归约至A还是B。同理遇到输入e时也会出现这种情况。

虽然合并同心项目可能会产生归约-归约冲突，但不会产生移入-归约冲突，是因为同心项目集在合并时只是合并展望符集合，而展望符只在归约时起作用在移入是不起作用的，因此只要合并前项目不存在移入-归约冲突的话合并后也不存在移入-归约冲突。

合并同心项集缺点

合并同心项集后，虽然不产生冲突，但可能会推迟错误的发现

推迟错误的发现.png

过程：

因为状态9合并至状态4，当输入d$时d移入栈后会进入状态4。
d归约成A后，d跟状态4出栈，A进栈，状态栈露出状态0。
0状态遇到A后进入状态2，状态2进栈。
接着$进栈，状态2遇到$后报错。
可见如果状态4在跟状态9合并前，在进入状态4前就已经报错。而合并后却进行额外的操作直至进入状态2才报错。可见合并同心项目集后确实推迟了错误的发现。

实际上合并同心项目时合并的其实是对应项的展望符集合，而移入动作与展望符没有任何关系，因此合并展望符集合不会影响移入操作的正确性。