41、P1 W6 U6.4 翻译Symbols符号

作者: shazizm | 来源:发表于2019-09-27 17:17 被阅读0次

视频:
如果本次课程对应的 Coursera 的视频打不开,可以点击下面链接
P1W6U6.3 -The Assembly Process-Handling Symbols

上节课讲了 A指令 和 C指令 如何处理。

这几课来讲 Symbols 该如何处理,因为没它们帮忙,我们写HACK的汇编语言时,的确有点麻烦。

Symbols 有三种

如下图中红色

1、variables (例如:@i、@sum)

设置变量,之后程序中会往变量里赋值。
但是变量在内存中的地址,其实是由 汇编器 来分配的。编程的人并不用关心。

2、labels(例如:(LOOP)、(STOP)、(END))

(LOOP)把下一行指令的地址存在 LOOP
@LOOP 把LOOP的地址写入A寄存器,以便下一行指令计算比较后,进行jump跳转。

3、pre-defined symbols(例如:R0、R1、Screen、Keyboard)

汇编器根据 HACK的硬件结构 提前提供的一些“variables”。

三种需要处理的符号

先从简单的pre-defined symbols ,一个一个讲解如何处理 三种符号。

处理 pre-defined symbols

pre-defined symbols 在HACK 的 汇编语言里 共设置了 23个,如下图红框里。

而且这种 pre-defined symbols 只会出现在 A指令中,也就是在@后面出现。

所以处理这种符号,只需要简单的用它们对应的十进制数替换就好了。

然后处理的方式就和无符号A指令一样了。

HACK中的23个预设符号

处理 labels

labels 主要是 用来程序跳转时,识别跳转位置的,而且明显labels存储的地址都是程序存储区(program memory)里的地址。

用括号()设置跳转地址。这是一个伪指令(pseudo-command),所以左边图里可以看出它和 white space (空行、注释)都是没有指令行号的。至于为什么用(),那是老师规定的。。。后面可能会解释

如下图红框內, LOOP 和 STOP 、END 存储的是它们下一行的指令的地址,所以翻译时只需要把 它们 和 红框內对应地址替换就可以了。

处理 variables

那么除了 pre-defined、(XXX)两种情况,那就是variables了。

如果汇编器第一次遇见 变量:
variable 会被分配一个存储地址,地址是从16开始的,为什么是16,老师规定的,所以如果程序里先出现@i ,那么 i 变量就会被分配到存储地址16的位置上。 之后例如又遇见@sum,那么 sum 就会分配到 存储地址为17的寄存器上。而且第一次出现的变量指令后,会紧跟着给变量赋值(例如下图@i 后M=1)。

如果第二次遇见 变量:
那么就会从第一次分配的存储地址里,取出对应赋的值。

可以看出在处理这三种符号时,都用到了一个 对应表

Symbol Table

这个Symbol Table 由汇编器维护,在翻译的过程中使用:

Symbol Table 应该是用后面老师编写汇编器时用的高级语言创建的一个键值表。

这个表一开始会提前添加好 pre-defined 符号,如下图 Initialization部分。

然后汇编器 会扫描两次汇编程序。

第一次,会通过()来在 Symbol Table 中添加 Label 符号。

第二次,如果扫描到符号,如果没有在 Symbol Table 中,那就只可能是Variables 符号了。

这样在翻译时,汇编器就可以用真正的值把汇编程序中的符号,全部替换掉,这样翻译汇编语言,就变成上节课见过的逻辑了。

汇编器 工作全流程 总结

如下图,基本上就是编写汇编器时,高级语言的整个逻辑了。。。

因为基本上就是之前提到的每一个分部的总和,所以看下图熟悉一下吧。

那么接下来的课程里,老师就要用 java 或者 python 来编写这个 汇编器了。

相关文章

网友评论

    本文标题:41、P1 W6 U6.4 翻译Symbols符号

    本文链接:https://www.haomeiwen.com/subject/cmcauctx.html