LALR分析法的提出
LR(1)分析法实际上是根据展望符集合的不同将原始的LR(0)项目进行分裂,分裂成不同的LR(1)项目。这就使得LR(1)的状态数较LR(0)的状态数多了很多。 比如说C语言的语法在构造其LR(0)分析表的时候通常只有几百个状态,而构造其LR(1)语法的时候会有几千个状态。为了使LR(1)实用化,必须要想办法去减少其状态数。
LALR分析法的提出.png如上图有4对同心项目集,I4与I11,I7与I13,I8与I10,I5与I12,把没有状态冲突的项目进行合并可以大大减少自动机的状态数,空间上会更节省。这就是LALR分析法的基本思想。
LALR( lookahead-LR)分析的基本思想
-
寻找具有 相同核心 的LR (1) 项集,并将这些项集合并为一个项集。 所谓项集的核心就是其第一分量的集合。
-
然后根据合并后得到的项集族构造语法分析表
-
如果分析表中没有语法分析动作冲突,给定的文法就称为LALR(1)文法,就可以根据该分析表进行语法分析。
合并同心项集
合并同心项集1.png 合并同心项目集2.png当第一次了解到合并同心项目这样的操作时,可能会产生这样的疑问,如上图中将I4与I11合并,合并后加入从状态6进入状态4后遇到下一个输入符号为=时逻辑上应该是要报错的,但如果按照合并后的LALR可以看出I4状态下遇上=也会进行归约操作。这种情况其实就设计到LALR的延迟处理下文将会有提及。
合并同心项集时产生归约-归约冲突的例子
归约-归约冲突.png状态6与状态9是一对同心项目集,即它们的LR(0)项目是相同的。但这两个状态合并会发生归约-归约冲突,合并后当遇到d时无法判断c该归约至A还是B。同理遇到输入e时也会出现这种情况。
虽然合并同心项目可能会产生归约-归约冲突,但不会产生移入-归约冲突,是因为同心项目集在合并时只是合并展望符集合,而展望符只在归约时起作用在移入是不起作用的,因此只要合并前项目不存在移入-归约冲突的话合并后也不存在移入-归约冲突。
合并同心项集缺点
合并同心项集后,虽然不产生冲突,但可能会推迟错误的发现
推迟错误的发现.png过程:
- 因为状态9合并至状态4,当输入d$时d移入栈后会进入状态4。
- d归约成A后,d跟状态4出栈,A进栈,状态栈露出状态0。
- 0状态遇到A后进入状态2,状态2进栈。
- 接着$进栈,状态2遇到$后报错。
可见如果状态4在跟状态9合并前,在进入状态4前就已经报错。而合并后却进行额外的操作直至进入状态2才报错。可见合并同心项目集后确实推迟了错误的发现。
实际上合并同心项目时合并的其实是对应项的展望符集合,而移入动作与展望符没有任何关系,因此合并展望符集合不会影响移入操作的正确性。
LALR(1)的特点
- 形式上与LR(1)相同
- 大小上与LR(0)/SLR相当
- 分析能力介于SLR和LR(1)二者之间
SLR<LALR(1)<LR(1)
合并后的展望符集合仍为FOLLOW集的子集
LALR相对于LR(1)会延迟错误的发现,因此其分析能力会低于LR(1)分析法。但其对信息的划分比SLR分析法更细致,因此它延迟发生的错误要比SLR分析要少分析能力也就比SLR分析要强。
网友评论