PL/0简单编译系统（二）

作者: Shiyi001 | 来源:发表于2017-01-17 15:39 被阅读0次

PL/0简单编译系统（二）
PL/0简单编译系统（一）
PL/0简单编译系统（三）
PL/0简单编译系统（四）
PL/0简单编译系统（零）
PL/0简单编译系统（六）
PL/0简单编译系统（五）
OLLVM in Android Studio
Pl0编译器源码阅读
递归算法：0/1背包问题

词法分析

词法分析又称词法分析器或者扫描器，是编译程序的基本子程序之一。本项目采用手工方式设计并实现词法分析程序。

词法分析的功能

扫描源程序，按语言的词法规则识别出各类单词符号（Token），并将有关字符组合成为单词并输出，同时进行词法检查。语言的保留字，标识符，常数和运算符等都是单词的例子。

Token分类

将PL/0编译系统中所有的字符，字符串的类型按如下表格分类：

类型	字符or字符串
保留字	begin, end, if,then, else, const, procedure,var,do,while, call,read, write, repeat, until
算数运算符	+ ,—，*，/
比较运算符	<> , < ,<= , >, >= ,=
赋值符	:= , =
标识符	变量名，过程名，常数名
常数	10,25等整数
界符	‘，’，‘.’，‘；’，‘（’，‘）’
其他符号	：，EOF

Token结构

在具体实现时，由于出错处理及语法分析的需求，定义如下Token结构：

public class Token {
    private SymType st; //token的类别
    private int line; //token所在行，错误处理使用
    private String value; //token的值，只有标识符和常量有值
}

Token分析程序的构造

首先，给出状态图：

状态图

根据状态图，可以写出分析程序analysis()

private Token analysis() {
    strToken = "";
    getChar();
    while ((ch == ' ' || ch == '\n' || ch == '\t' || ch == '\0') && searchPtr < buffer.length) {
        if (ch == '\n') {
            line++;
        }
        getChar();
    }
    if (ch == '$' && searchPtr >= buffer.length) { //到达文件末尾
        return new Token(SymType.EOF, line, "-1");
    }
    if (isLetter()) { //首位为字母，可能为保留字或者变量名
        while (isLetter() || isDigit()) {
            strToken += ch;
            getChar();
        }
        retract();
        for (int i = 0; i < keyWords.length; i++) {
            if (strToken.equals(keyWords[i])) { //说明是保留字
                return new Token(SymType.values()[i], line, "-");
            }
        }
        //不是保留字，则为标识符，需要保存值
        return new Token(SymType.SYM, line, strToken);
    } else if (isDigit()) { //首位为数字，即为整数
        while (isDigit()) {
            strToken += ch;
            getChar();
        }
        retract();
        return new Token(SymType.CONST, line, strToken);
    } else if (ch == '=') { //等号
        return new Token(SymType.EQU, line, "-");
    } else if (ch == '+') { //加号
        return new Token(SymType.ADD, line, "-");
    } else if (ch == '-') { //减号
        return new Token(SymType.SUB, line, "-");
    } else if (ch == '*') { //乘号
        return new Token(SymType.MUL, line, "-");
    } else if (ch == '/') { //除号
        return new Token(SymType.DIV, line, "-");
    } else if (ch == '<') { //小于或不等于或小于等于
        getChar();
        if (ch == '=') {
            return new Token(SymType.LESE, line, "-");
        } else if (ch == '>') {
            return new Token(SymType.NEQE, line, "-");
        } else {
            retract();
            return new Token(SymType.LES, line, "-");
        }
    } else if (ch == '>') { //大于或大于等于
        getChar();
        if (ch == '=') {
            return new Token(SymType.LARE, line, "-");
        } else {
            retract();
            return new Token(SymType.LAR, line, "-");
        }
    } else if (ch == ',') { //逗号
        return new Token(SymType.COMMA, line, "-");
    } else if (ch == ';') { //分号
        return new Token(SymType.SEMIC, line, "-");
    } else if (ch == '.') { //点
        return new Token(SymType.POI, line, "-");
    } else if (ch == '(') { //左括号
        return new Token(SymType.LBR, line, "-");
    } else if (ch == ')') { //右括号
        return new Token(SymType.RBR, line, "-");
    } else if (ch == ':') { //赋值号
        getChar();
        if (ch == '=') {
            return new Token(SymType.CEQU, line, "-");
        } else {
            retract();
            return new Token(SymType.COL, line, "-");
        }
    }
    return new Token(SymType.EOF, line, "-");
}

analysis()每次分析出一个Token。对代码进行一遍遍历，即可得到源程序的token数组。

词法分析
 符号表管理
 语法和语义分析
 Pcode生成
 出错管理

网友评论

本文标题：PL/0简单编译系统（二）

本文链接：https://www.haomeiwen.com/subject/oonubttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

PL/0简单编译系统（二）

词法分析

词法分析的功能

Token分类

Token结构

Token分析程序的构造

相关文章

PL/0简单编译系统（二）

PL/0简单编译系统（一）

PL/0简单编译系统（三）

PL/0简单编译系统（四）

PL/0简单编译系统（零）

PL/0简单编译系统（六）

PL/0简单编译系统（五）

OLLVM in Android Studio

Pl0编译器源码阅读

递归算法：0/1背包问题

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读