美文网首页
PL/0简单编译系统(二)

PL/0简单编译系统(二)

作者: Shiyi001 | 来源:发表于2017-01-17 15:39 被阅读0次

词法分析

词法分析又称词法分析器或者扫描器,是编译程序的基本子程序之一。本项目采用手工方式设计并实现词法分析程序。

词法分析的功能

扫描源程序,按语言的词法规则识别出各类单词符号(Token),并将有关字符组合成为单词并输出,同时进行词法检查。语言的保留字,标识符,常数和运算符等都是单词的例子。

Token分类

将PL/0编译系统中所有的字符,字符串的类型按如下表格分类:

类型 字符or字符串
保留字 begin, end, if,then, else, const, procedure,var,do,while, call,read, write, repeat, until
算数运算符 + ,—,*,/
比较运算符 <> , < ,<= , >, >= ,=
赋值符 := , =
标识符 变量名,过程名,常数名
常数 10,25等整数
界符 ‘,’,‘.’,‘;’,‘(’,‘)’
其他符号 :,EOF

Token结构

在具体实现时,由于出错处理及语法分析的需求,定义如下Token结构:

public class Token {
    private SymType st; //token的类别
    private int line; //token所在行,错误处理使用
    private String value; //token的值,只有标识符和常量有值
}

Token分析程序的构造

首先,给出状态图:

状态图

根据状态图,可以写出分析程序analysis()

private Token analysis() {
    strToken = "";
    getChar();
    while ((ch == ' ' || ch == '\n' || ch == '\t' || ch == '\0') && searchPtr < buffer.length) {
        if (ch == '\n') {
            line++;
        }
        getChar();
    }
    if (ch == '$' && searchPtr >= buffer.length) { //到达文件末尾
        return new Token(SymType.EOF, line, "-1");
    }
    if (isLetter()) { //首位为字母,可能为保留字或者变量名
        while (isLetter() || isDigit()) {
            strToken += ch;
            getChar();
        }
        retract();
        for (int i = 0; i < keyWords.length; i++) {
            if (strToken.equals(keyWords[i])) { //说明是保留字
                return new Token(SymType.values()[i], line, "-");
            }
        }
        //不是保留字,则为标识符,需要保存值
        return new Token(SymType.SYM, line, strToken);
    } else if (isDigit()) { //首位为数字,即为整数
        while (isDigit()) {
            strToken += ch;
            getChar();
        }
        retract();
        return new Token(SymType.CONST, line, strToken);
    } else if (ch == '=') { //等号
        return new Token(SymType.EQU, line, "-");
    } else if (ch == '+') { //加号
        return new Token(SymType.ADD, line, "-");
    } else if (ch == '-') { //减号
        return new Token(SymType.SUB, line, "-");
    } else if (ch == '*') { //乘号
        return new Token(SymType.MUL, line, "-");
    } else if (ch == '/') { //除号
        return new Token(SymType.DIV, line, "-");
    } else if (ch == '<') { //小于或不等于或小于等于
        getChar();
        if (ch == '=') {
            return new Token(SymType.LESE, line, "-");
        } else if (ch == '>') {
            return new Token(SymType.NEQE, line, "-");
        } else {
            retract();
            return new Token(SymType.LES, line, "-");
        }
    } else if (ch == '>') { //大于或大于等于
        getChar();
        if (ch == '=') {
            return new Token(SymType.LARE, line, "-");
        } else {
            retract();
            return new Token(SymType.LAR, line, "-");
        }
    } else if (ch == ',') { //逗号
        return new Token(SymType.COMMA, line, "-");
    } else if (ch == ';') { //分号
        return new Token(SymType.SEMIC, line, "-");
    } else if (ch == '.') { //点
        return new Token(SymType.POI, line, "-");
    } else if (ch == '(') { //左括号
        return new Token(SymType.LBR, line, "-");
    } else if (ch == ')') { //右括号
        return new Token(SymType.RBR, line, "-");
    } else if (ch == ':') { //赋值号
        getChar();
        if (ch == '=') {
            return new Token(SymType.CEQU, line, "-");
        } else {
            retract();
            return new Token(SymType.COL, line, "-");
        }
    }
    return new Token(SymType.EOF, line, "-");
}

analysis()每次分析出一个Token。对代码进行一遍遍历,即可得到源程序的token数组。

词法分析
符号表管理
语法和语义分析
Pcode生成
出错管理

相关文章

  • PL/0简单编译系统(二)

    词法分析 词法分析又称词法分析器或者扫描器,是编译程序的基本子程序之一。本项目采用手工方式设计并实现词法分析程序。...

  • PL/0简单编译系统(一)

    上文中我们介绍了PL/0的文法,接下来我们将介绍一个完整的编译系统各个部分~ 编译系统介绍 一个经典的编译程序一般...

  • PL/0简单编译系统(三)

    符号表管理 符号表是编译过程中编译程序用来记录源程序中的各种名字(即标识符)的特性信息的表格,符号表的每一个登记项...

  • PL/0简单编译系统(四)

    语法分析和语义分析 由于本项目使用的是递归下降子程序法,对每一个PL/0中的语法成分都进行了分析,并单独编写为一个...

  • PL/0简单编译系统(零)

    本学期修了《编译原理》这门课。课程大作业是实现一个PL/0编译器。接下来将记录在实现过程中的心得、遇到的问题和解决...

  • PL/0简单编译系统(六)

    出错管理 在编译过程中,既可能出现语法错误,也可能出现语义错误(如变量未声明等)。本项目将错误分为24类,如下表所...

  • PL/0简单编译系统(五)

    Pcode生成 P-code 语言是一种栈式机的语言。此类栈式机没有累加器和通用寄存器,有一个栈式存储器,有四个控...

  • OLLVM in Android Studio

    0x01 Ollvm编译 系统: macos 10.15.6 在之前的macos系统上,编译ollvm还是比较流畅...

  • Pl0编译器源码阅读

    写在前面 其实这个是我的编译原理一次作业的草稿,也是第一次阅读编译器的源码,虽然比较简单,但是也是第一次,分享一下...

  • 递归算法:0/1背包问题

    1、环境配置: 系统:win10 编程语言:C++ 编译器:DevC++ 2、问题描述: 简单的0/1背包问题:设...

网友评论

      本文标题:PL/0简单编译系统(二)

      本文链接:https://www.haomeiwen.com/subject/oonubttx.html