当前位置：和泉文库 > 计算机 > 浏览文档

《编译原理》课程书籍文献（编译原理及实践）第5章自底向上的分析

• 自底向上分析概览 • Yacc: LALR(1)分析程序的生成器 • LR(0)项的有穷自动机及L R ( 0 )分析 • 使用Ya c c生成T I N Y分析程序 • SLR(1)分析 • 自底向上分析程序中的错误校正 • 一般的L R ( 1 )和L A L R ( 1 )分析

文件格式：PDF，文件大小：1.39MB，售价：12.13元

共48页，可试读17页，点击往前阅读 ↑↑

文档详细内容（约48页）

160 翁译原理及实践 China-pub.Co 下载表5-4例5.9中的文法的分析表状态动作规则输入 Goto 0 4-A 2 归约 A-a 3 移进移进归约 A-(A) 在这样的分析表中的空白项表示的是错误。当必须要进行错误恢复时，则需要准确地指出分析程序要为每个这些空白项采取什么动作。后面一节将讨论这个问题。 5.3SLR(1)分析 5.3.1SLR(1)分析算法简单LR(I)分析，或SLR(I)分析，也如上一节中一样使用了LR(O)项目集合的DFA。但是通过使用输入串中下一个记号来指导它的动作，它大大地提高了LR(O)分析的能力。它通过两种方法做到这一点。首先，它在一个移进之前先考虑输入记号以确保存在着一个恰当的DFA 其次，它使用如4.3节所构造的非终结符的Foow集合来决定是否应执行一个归约。令人吃惊的是，先行的这个简单应用的能力强大得足以分析几乎所有的一般的语言构造。定义：SLR(I)分析算法(SLR(I)parsing algorithm)。令s为当前状态（位于分析栈的顶部)。则动作可定义如下： 1.若状态s包含了格式A一Q.邓的任意项目，其中X是一个终结符，且X是输入串中的下一个记号，则动作将当前的输入记号移进到栈中，且被压入到栈中的新状态是包含了项目A一XB的状态 2.若状态s包含了完整项目A一Y.,则输入串中的下一个记号是在Follow(4)中，所以动作是用规则A→y归约。用规则S→S归约与接受等价，其中S是开始状态：只有当下一个输入记号是$时，这才会发生⊙。在所有的其他情况中，新状态都是如下计算的：别除串α和所有它的来自分析栈中的对应状态。相对应地， DFA回到α开始构造的状态。通过构造，这个状态必须包括格式B一Y.AB的个项目。将A压入到栈中，并将包含了项目B一aA.B的状态压入。 3.若下一个输入记号都不是上面两种情况所提到的，则声明一个错误若上述的SLR(I)分析规则并不导致二义性，则文法为SLR()文法(SLR(I)grammar)。特别地，当且仅当对于任何状态5，以下的两个条件： I)对于在s中的任何项目A一a邓，当X是一个终结符，且X在Follow(B)中时，s中没有完整的项目B→y,。 2)对于在s中的任何两个完整项目A→a.和B→B,Follow(A)Follow(B)为空。。实际上，任何文法扩充的开始状态了的Fow集合总是只由S组成，这是因为S只出现在文法规则S一S中

表5-4 例5 . 9中的文法的分析表状态动作规则输入 G o t o ( a ) A 0 移进 3 2 1 1 归约 A¢→ A 2 归约 A→ a 3 移进 3 2 4 4 移进 5 5 归约 A→ ( A ) 在这样的分析表中的空白项表示的是错误。当必须要进行错误恢复时，则需要准确地指出分析程序要为每个这些空白项采取什么动作。后面一节将讨论这个问题。 5.3 SLR(1)分析 5.3.1 SLR(1)分析算法简单L R ( 1 )分析，或S L R ( 1 )分析，也如上一节中一样使用了 L R ( 0 )项目集合的D FA。但是，通过使用输入串中下一个记号来指导它的动作，它大大地提高了 L R ( 0 )分析的能力。它通过两种方法做到这一点。首先，它在一个移进之前先考虑输入记号以确保存在着一个恰当的 D FA。其次，它使用如 4 . 3节所构造的非终结符的 F o l l o w集合来决定是否应执行一个归约。令人吃惊的是，先行的这个简单应用的能力强大得足以分析几乎所有的一般的语言构造。定义：S L R ( 1 )分析算法(SLR(1) parsing algorithm)。令s 为当前状态(位于分析栈的顶部)。则动作可定义如下： 1. 若状态s 包含了格式A→a.Xb的任意项目，其中X是一个终结符，且X是输入串中的下一个记号，则动作将当前的输入记号移进到栈中，且被压入到栈中的新状态是包含了项目A→aX.b的状态。 2. 若状态s 包含了完整项目A→g.，则输入串中的下一个记号是在F o l l o w (A)中，所以动作是用规则A→g 归约。用规则S¢→S归约与接受等价，其中S是开始状态；只有当下一个输入记号是 $时，这才会发生。在所有的其他情况中，新状态都是如下计算的：删除串 a和所有它的来自分析栈中的对应状态。相对应地， D FA回到a开始构造的状态。通过构造，这个状态必须包括格式 B→g. Ab的一个项目。将A压入到栈中，并将包含了项目B→aA.b的状态压入。 3. 若下一个输入记号都不是上面两种情况所提到的，则声明一个错误。若上述的S L R ( 1 )分析规则并不导致二义性，则文法为 S L R ( 1 )文法(SLR(1) grammar)。特别地，当且仅当对于任何状态s，以下的两个条件： 1) 对于在s 中的任何项目A→a.Xb，当X是一个终结符，且X在Follow (B) 中时，s 中没有完整的项目B→g.。 2) 对于在s 中的任何两个完整项目A→a.和B→b.，F o l l o w (A) Follow(B)为空。 1 6 0 编译原理及实践实际上，任何文法扩充的开始状态S¢ 的F o l l o w集合总是只由$组成，这是因为S¢ 只出现在文法规则S¢ →S中。下载

China-pub.com 第5章自底向上的分析 161 下载均满足时，文法为SLR(I): 若第1个条件不满足，就表示这是一个移进-归约冲突(shin-reduce conflict)。若第2个条件不满足，就表示这是一个归约-归约冲突(reduce-reduce conflict)。这两个条件同前一章中所述的LL()分析的两个条件在本质上是类似的。但是如同使用所有的移进-归约分析方法一样，可将决定使用哪个文法规则推迟到最后，同时还可考虑一个更强大的分析程序。 SLR(I)分析的分析表也可以用与前一节所述的LR(O)分析的分析表的类似方式构造。两者的差别如下：由于状态在SL(1)分析程序中可以具有移进和归约（取决于先行），输入部分中的每项现在必须要有一个“移进”或“归约”的标签，而且文法规则选择也必须被放在标有“归约”的项中。这还使得动作和规则列成为多余。由于输入结束符号$也可成为一个合法的先行，所以必须为这个符号在输入部分建立一个新的列。我们将SLR(1)分析表的构造放在SLR(1)分析的第1个示例中。例5.10考虑例5.8中的文法，它的项目集合的DFA已列在了图5-4中。正如前面所述的，这个文法不是LR(O),而是SLR(I)。非终结符的Follow集合是Follow(E)={$}和Follow(E)={$,+}。表5-5是SLR(1)分析表。在表中，移进由表项中的字母s指出，归约由字母r指出。因此，在输入+的状态1中，指出了一个移进，以及一个到状态3的转换。另一方面，在输入+的状态2中，指出了利用产生式E一n归约。在输入$的状态1中还用动作“接受”代替了r(E一E)。表5-5例5.10的SLR(1)分析表翰入 Goto n + E 接受 r(En r(E-n) E-E+) r(E-E+n) 这个示例的最后是串n+n+n的分析。表5-6是它的分析步骤。该图的步骤1以输入记号n 的状态0开始，接着分析表指出动作“s2”,即：将记号移进到栈中并进入到状态2。在表5-6中，将它与阶段“shin2” 起指出来。在该图的步骤2中，分析程序是在状态2中且带有输入记号 +,表还指出了用规则E·n归约。此时，从栈中弹出状态2和记号n。使状态0腿盛出来。将符号E压入且将E的Goo从状态0带到状态1。第3步中的分析程序是带有输入记号+的状态1，且表还指出了移进以及指向状态3的转换。在输入的状态3中，表也指出了一个移进和到状态4的转换。在输入+的状态4中，表指出用规则E一E+n归约。这个归约是由将串E+n和与它相结合的来自栈的状态弹出来完成的，并再一次禁露状态0，将E压入并将Gto带到状态1中。分析的其他步骤是类似的。表5-6例5.10的分析动作分析栈输入动作 n+atas 移进2

均满足时，文法为S L R ( 1 )。若第1个条件不满足，就表示这是一个移进-归约冲突 (shift-reduce conflict)。若第2个条件不满足，就表示这是一个归约-归约冲突(reduce-reduce conflict)。这两个条件同前一章中所述的 L L ( 1 )分析的两个条件在本质上是类似的。但是如同使用所有的移进-归约分析方法一样，可将决定使用哪个文法规则推迟到最后，同时还可考虑一个更强大的分析程序。 S L R ( 1 )分析的分析表也可以用与前一节所述的 L R ( 0 )分析的分析表的类似方式构造。两者的差别如下：由于状态在S L R ( 1 )分析程序中可以具有移进和归约 (取决于先行)，输入部分中的每项现在必须要有一个“移进”或“归约”的标签，而且文法规则选择也必须被放在标有“归约”的项中。这还使得动作和规则列成为多余。由于输入结束符号 $也可成为一个合法的先行，所以必须为这个符号在输入部分建立一个新的列。我们将 S L R ( 1 )分析表的构造放在S L R ( 1 )分析的第1个示例中。例5.10 考虑例5 . 8中的文法，它的项目集合的D FA已列在了图5 - 4中。正如前面所述的，这个文法不是L R ( 0 )，而是S L R ( 1 )。非终结符的F o l l o w集合是F o l l o w (E¢) = {$}和Follow (E) = {$, +}。表5 - 5是S L R ( 1 )分析表。在表中，移进由表项中的字母 s 指出，归约由字母r 指出。因此，在输入+的状态1中，指出了一个移进，以及一个到状态 3的转换。另一方面，在输入 +的状态2中，指出了利用产生式E→n 归约。在输入$的状态1中还用动作“接受”代替了r ( E→E )。表5-5 例5 . 1 0的S L R ( 1 )分析表状态输入 G o t o n + $ E 0 s 2 1 1 s 3 接受 2 r (E→n) r (E→n) 3 s 4 4 r ( E→E + n) r (E→E + n) 这个示例的最后是串n + n + n 的分析。表5 - 6是它的分析步骤。该图的步骤1以输入记号n 的状态0开始，接着分析表指出动作“s 2”，即：将记号移进到栈中并进入到状态2。在表5 - 6中，将它与阶段“shift 2”一起指出来。在该图的步骤 2中，分析程序是在状态2中且带有输入记号 +，表还指出了用规则E→n 归约。此时，从栈中弹出状态 2和记号n。使状态0曝露出来。将符号E压入且将E的G o t o从状态0带到状态1。第3步中的分析程序是带有输入记号+的状态1，且表还指出了移进以及指向状态 3的转换。在输入n 的状态3中，表也指出了一个移进和到状态 4的转换。在输入+的状态4中，表指出用规则E→E + n归约。这个归约是由将串E + n和与它相结合的来自栈的状态弹出来完成的，并再一次暴露状态 0，将E压入并将G o t o带到状态1中。分析的其他步骤是类似的。表5-6 例5 . 1 0的分析动作分析栈输入动作 1 $ 0 n + n + n $ 移进2 第 5章自底向上的分析 1 6 1 下载

164翁译隙理及实践 China-pub.com 下载 Follow (S)=Follow ()=is.else 现在就可以看到由悬挂else问题引起的分析冲突了。当发生在DFA的状态5中时，其中的完整项目I→1￡S.指出规则1→1￡S的归约将发生在输入e1se和S中，但项目1→1￡S.e1seS却指出输入记号的一个移进将发生在e1se上。因此悬挂else将导致在SLR(1)分析表的移进-归约冲突。很明显，用移进取代归约的消除二义性的规则可以消除这个冲突，并会根据最近嵌套规则作出分析（若用归约取代移进，就没有办法在DFA中输入状态6或状态7，这将导致虚假的分析错误)。表5-9是由该文法引出的SLR(1)分析表。在该表中为归约动作中的文法规则选择使用了编号，用它来代替写出规则本身。编号如下： (1)S→1 (2)S-other (3)1→iES (4)1-ifSelseS 请注意，无需为扩充产生式了一S端号，这是由于用该规则实现的归约与接受相对应，且在表中已被写作“接受”了。读者应注意到在归约项中使用的产生式编号容易引起与在移进和G0o项中所用到的编号混淆。例如，在表5-9的表的状态5中，输入©1se下的项目是s6,它指出一个移进以及到状态6的转换，但在输入S下的项目却是3，它指出用产生式编号3实现的归约（即：一i￡S)。表5-9还为了移进而删除了移进-归约冲突。我们将表中的项目渐渐减少以显示出在何处发生了冲突。表5-9例5.12的SLR(1)分析表（删除了分析冲突）状态输入 Goto if Else other s S1 0 4 s3 1 2 1 接受 r 3+ 2 2 2 5 3 6 s4 7 2 7 r4 r4 5.3.3SLR(1)分析能力的局限性 SLR(1)分析是LR0)分析的一个简单但有效的扩展，而LR(O)分析的能力足以处理几平所有实际的语言结构。不幸的是，在有些情况下，SL(1)分析能力并不太强，而正由于这个原因我们还需要学习更强大的一般的LR(1)和LALR(1)分析。下一个例子是SLR(1)分析失败的典型情况。例5.13考虑语句的以下文法，它是从Pascal中抽取和简化而得来的（在C中也有类似的情况

Follow (S) = Follow (I ) = {$, e l s e } 现在就可以看到由悬挂e l s e问题引起的分析冲突了。当发生在D FA的状态5中时，其中的完整项目I → i f S.指出规则I → i f S的归约将发生在输入e l s e和$中，但项目I → i f S. e l s e S 却指出输入记号的一个移进将发生在 e l s e上。因此悬挂e l s e将导致在S L R ( 1 )分析表的移进-归约冲突。很明显，用移进取代归约的消除二义性的规则可以消除这个冲突，并会根据最近嵌套规则作出分析(若用归约取代移进，就没有办法在 D FA中输入状态6或状态7，这将导致虚假的分析错误)。表5 - 9是由该文法引出的S L R ( 1 )分析表。在该表中为归约动作中的文法规则选择使用了编号，用它来代替写出规则本身。编号如下： (1) S → I (2) S → o t h e r (3) I → i f S (4) I → i f S e l s e S 请注意，无需为扩充产生式 S¢→S编号，这是由于用该规则实现的归约与接受相对应，且在表中已被写作“接受”了。读者应注意到在归约项中使用的产生式编号容易引起与在移进和 G o t o项中所用到的编号混淆。例如，在表5 - 9的表的状态5中，输入e l s e下的项目是s 6，它指出一个移进以及到状态 6的转换，但在输入$下的项目却是r 3，它指出用产生式编号3实现的归约(即：I→i f S)。表5 - 9还为了移进而删除了移进-归约冲突。我们将表中的项目渐渐减少以显示出在何处发生了冲突。表5-9 例5 . 1 2的S L R ( 1 )分析表(删除了分析冲突) 状态输入 G o t o i f E l s e o t h e r $ S I 0 s 4 s 3 1 2 1 接受 2 r 1 r 1 3 r 2 r 2 4 s 4 s 3 5 2 5 s 6 r 3 6 s 4 s 3 7 2 7 r 4 r 4 5.3.3 SLR(1)分析能力的局限性 S L R ( 1 )分析是L R ( 0 )分析的一个简单但有效的扩展，而 L R ( 0 )分析的能力足以处理几乎所有实际的语言结构。不幸的是，在有些情况下， S L R ( 1 )分析能力并不太强，而正由于这个原因，我们还需要学习更强大的一般的 L R ( 1 )和L A L R ( 1 )分析。下一个例子是S L R ( 1 )分析失败的典型情况。例5.13 考虑语句的以下文法，它是从Pascal 中抽取和简化而得来的（在C中也有类似的情况 1 6 4 编译原理及实践下载

点击进入文档下载页（PDF格式）

共48页，可试读17页，点击继续阅读 ↓↓

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录