当前位置：和泉文库 > 计算机 > 浏览文档

《编译原理》课程教学资源（教材和参考书）编译原理-清华张素琴-第2版

文件格式：PDF，文件大小：13.57MB，售价：41.2元

文档详细内容（约356页）

预处理程序来产生，另外，为得到能运行的机器代码，编译程序的输出可能仍需要进一步地处理。前面介绍过，编译程序的基本任务是将源语言程序翻译成等价的日标语言程序我们知道，源语言的种类成千上万，从常用的诸如FORTRAN,PASCAL和C语言，到各种各样的计算机应用领域的专用语言，而目标语言也是成千上万的，加上编译程序根据它们的构造不同，所执行的具体功能的差异又分成了各种类型，比如：一趟编译、多趟编译的、具有调试或优化功能的等等，尽管存在这些明显的复杂因素，但是任何编译程序所必须执行的主要任务基本是一样的，通过理解这些任务，使用同样的基本技术，我们可以为各种各样的源语言和目标语言设计和构造编译程序。据说第一个编译程序的出现是在20世纪50年代早期，很难讲出确切的时间，国为当初大量的实验和实现工作是由不同的小组独立完成的，多数早期的编译工作是将算术公式翻译成机器代码。用现在的标准来衡量，当时的编译程序能完成的工作十分初步，如只允许简单的单目运算，数据元素的命名方式有很多限制，然而它们莫定了对高级语言编译系统的研究和开发的基础，20世纪50年代中期出现了FORTRAN等一批高级语言，相应的一批编译系统开发成功。随着编译技术的发展和社会对编译程序需求的不断增长，20 世纪50年代末有人开始研究编译程序的自动生成工具，提出并研制编译程序的编译程序。它的功能是以任一语言的词法规则、语法规则和语义解释出发，自动产生该语言的编译程序。目前很多自动生成工具已广泛使用，如词法分析程序的生成系统LEX,语法分析程序的生成系统YACC等，20世纪60年代起，不断有人使用自展技术来构造编译程序自展的主要特征是用被编译的语言来书写该语言自身的编译程序。1971年，PASCAL的编译程序用自展技术生成后，其影响就越来越大。随着并行技术和并行语言的发展，处理并行语言的并行编译技术正在深入研究之中将串行程序转换成并行程序的自动并行编译技术也正在深入研究之中， 1.2编译过程概述编译程序完成从源程序到目标程序的翻译工作，是一个复杂的整体的过程。从概念上来讲，一个编译程序的整个工作过程是划分成阶段进行的，每个阶段将源程序的一种表示形式转换成另一种表示形式，各个阶段进行的操作在逻辑上是紧密连接在一起的，图1.3 给出了一个编译过程的各个阶段，这是一种典型的划分方法。事实上，某些阶段可能组合在一起，这些阶段间的源程序的中间表示形式就没必要构造出来了，图1.3中将编译过程划分成了词法分析，语法分析、语义分析、中间代码生成，代码优化和目标代码生成六个阶段，我们将分别介绍各阶段的任务。另外两个重要的工作：表格管理和出错处理与上述六个阶段都有联系，编译过程中源程序的各种信息被保留在种种不同的表格里，编译各阶段的工作都涉及到构造、查找或更新有关的表格，因此需要有表格管理的工作：如果编译过程中发现源程序有错误，编译程序应报告错误的性质和错误发生的地点，并且将错误所造成的影响限制在尽可能小的范围内，使得源程序的其余部分能继续被编译下去，有些编译程序还能自动校正错误，这些工作称之为出错处理。 ·2

我们从源程序在不同阶段所被转换成的表示形式的不同来介绍各个阶段的任务。源程序词法分析阶段是编译过程的第一个阶词法分析段。这个阶段的任务是从左到右一个字符一个字符地读入源程序，对构成源程序的字符流进语法分析行扫描和分解，从而识别出一个个单词（也称单语义分析司符号或符号)。这里所谓的单词是指逻辑上紧密相连的一组字符，这些字符具有集体含义。比中间代码生皮如标识符是由字母字符开头，后限字母、数字字代码优化符的字符序列组成的一种单词。保留字（关键字或基本字)是一种单词，此外还有算符，界符等目标代码生成等。例如某源程序片断如下目标程序 begin var sum.first,count:real;sum : first+-count*l0end.词法分析阶段将构成这图1.3编译的各个阶段段程序的字符组成了如下单词序列： 1.保留字 begin 2.保留字 var 3.标识符 sum 4,逗号 5.标识符 first 6.逗号 7.标识符 count 8.目号 9.保留字 real 10.分号 11.标识符 sum 12.赋值号 13.标识符 first 14.加号 15.标识符 count 16.乘号 17.整数 10 18.保留字end 19.界符可以看出，五个字符即b,e,g,i和n构成了一个分类为保留字的单词begin,两个字符即：和=构成了表示赋值运算的符号：=，这些单词间的空格在词法分析阶段都被滤掉了。我们使用idl,id2和id3分别表示sum,first和count三个标识符的内部形式，那么经过词法分析后上述程序片断中的赋值语句sum:=-first-十count*l0则表示为id1= id2+id3*10 语法分析是编译过程的第二个阶段。语法分析的任务是在词法分析的基础上将单词序列分解成各类语法短语，如“程序”，“语句”，“表达式”等等。一般这种语法短语，也称语法单位，可表示成语法树，比如上述程序段中的单词序列： id1=id2+id3*10经语法分析得知其是PASCAI.语言的“赋值语句”，表示成如图1.4所示的语法树或是图1.5所示的那种形式. 语法分析所依据的是语言的语法规则，即描述程序结构的规则，通过语法分析确定整个输入串是否构成一个语法上正确的程序。 3▣

报告错误。又比如某些语言规定运算对象可被强制，那么当二目运算施于一整型和-一实型时，编译程序应将整型转换成实型而不能认为是源程序的错误，假如在语句sum:=frs 十count*10中，*的两个运算对象：count是实型，10是整型，则语义分析阶段进行类型审查之后，在语法分析所得到的分析树上增加一语义处理结点，表示整型变成实型的一目算符inttoreal,则图l.5的树变成图1.6所示的那样， id? 图1,6桶入语义处理结点的树中间代码生成在进行了上述的语法分析和语义分析阶段的工作之后，有的编译程序将源程序变成一种内部表示形式，这种内部表示形式叫做中间语言或中间代码。所调 “中间代码”是一种结构简单，含义明确的记号系统，这种记号系统可以设计为多种多样的形式，重要的设计原则为两点：一是容易生成：二是容易将它翻译成目标代码。很多编译程序采用了一种近似“三地址指令”的“四元式”中间代码，这种四元式的形式为：（运算符，运算对象1，运算对象2，结果)。比如源程序sum=first-十count￥10可生成四元式序列，如图1.7所示，其中ti =1,2,3)是编译程序生成的临时名字，用于存放运算结果的。 (1) (inttoreal 10 t) (2) (￥ id3 t1t） (3) id2tata） (4) (= t id1) 图1.7中间代码代码优化在此阶段的任务是对前阶段产生的中间代码进行变换或进行改造，目的是使生成的目标代码更为高效，即省时间和省空间.比如图1.7的代码可变换为图1.8的代码，仅剩了两个四元式而执行同样的计算。也就是编译程序的这个阶段已经把将10转换成实型数的代码化简掉了，同时因为t,仅仅用来将其值传递给d1,也可以被化简掉，这只是优化工作的两个方面，此外诸如公共子表达式的删除，强度削弱、循环优化等优化工作将在第11章详细介绍。 (￥id310.0t) (id2 t id1) 图1.8优化后的中间代码目标代码生成这一阶段的任务是把中间代码变换成特定机器上的绝对指令代码或可重定位的指令代码或汇编指令代码。这是编译的最后阶段，它的工作与硬件系统结构和指令含义有关，这个阶段的工作很复杂，涉及到硬件系统功能部件的运用、机器指令的选 5

点击进入文档下载页（PDF格式）

共356页，可试读40页，点击继续阅读 ↓↓

您可能感兴趣的文档

点击购买下载（PDF）

下载及服务说明

购买前请先查看本文档预览页，确认内容后再进行支付；
如遇文件无法下载、无法访问或其它任何问题，可发送电子邮件反馈，核实后将进行文件补发或退款等其它相关操作；
邮箱：

文档浏览记录