三.编写简单的汇编启动程序

作者: wit_yuan | 来源:发表于2017-11-27 16:48 被阅读0次

三.编写简单的汇编启动程序
嵌入式学习笔记之用C语言点亮一个LED
《编码》24章高级语言与低级语言 18/71天阅读
单片机STM32的启动文件详解--学习笔记
CSAPP复习（1月24日）
七.第一个程序
编写完整的汇编程序
jvm性能调优-1
通过汇编一个简单的C程序，分析汇编代码理解计算机是如何工作的
汇编语言 | 04 - 开始编程

1 汇编启动程序

这部分主要是用来学习linux-0.11，做预前汇编准备工作。同时也是一个启动程序，用来引导操作系统代码。

1.1 工具

1.bin86，所以我们使用的是as86汇编语言。可以使用：

$ sudo apt-get intall bin86

安装软件工具。然后可以使用：

$ man 1 as86

查询相应的汇编代码。

这只是一个boot部分的代码，使用的是as86汇编器，ld86链接器，而如果我们要加载head的代码，则需要使用GNU的gas汇编器，用GNU ld链接。

需要知道，目前这部分的boot代码，对于整个bios来说，只有512B，也就是说，启动整个linux系统，还需要第二部分的代码，也就是loader代码，之后才是Linux代码。

对于loader代码，比较有名的有Lilo,Grub和spfdisk等。

注意事项

as86汇编器对于boot.s程序编译时生成boot.o目标文件，再用ld86进行链接操作，生成MINIX结构的可执行文件，但在Linux中用作引导时需要去除其MINIX文件头结构。

2.GNU as工具

as汇编语言语法和intel的汇编语言有很大不同，被称为AT&T语法，最主要的区别是以下几点：

a. AT&T语法立即操作数前面加”$”,而寄存器操作数前面要加%与程序计数器相关的语句操作数前面要加*，intel没有限制。
b. AT&T语法的源操作数和目的操作数与intel的位置正好相反，它是源在前，目的在后。
c. AT&T语法中内存操作数的长度由操作码的最后一个字符决定比如b for byte, w for word, l for long，
Intel则通过前缀区分比如Intel的是mov al，byte ptr foo，而AT&T中是movb foo,%al 。
d. AT&T不提供对多代码段的支持，UNIX类操作系统要求所有代码在一个段中。

1.2 基础知识

默认的引导代码会放在软盘的引导扇区，也就是软盘的头512个字节位置。而bios会将这部分代码读取出来，放到内存的0x7c00:0x0处。因此，我们的代码运行地址都是基于0x7c00的。

intel架构下的寄存器

只列出关键的一些寄存器：

8个数据寄存器：EAX、EBX、ECX、EDX
2个变址寄存器：ESI、EDI  
2个指针寄存器：ESP、EBP
1个标志寄存器：EFLAGS
6个段寄存器：CS、DS、ES、FS、GS、SS

1.数据寄存器
32位CPU有4个32位的通用寄存器eax、ebx、ecx和edx。对低16位数据的存取，不会影响高16位的数据。这些低16位寄存器分别命名为：ax、bx、cx和dx，它和先前的CPU中的寄存器相一致。
4个16位寄存器又可分割成8个独立的8位寄存器(ax：ah-al、bx：bh-bl、cx：ch-cl、dx：dh-dl)，每个寄存器都有自己的名称，可独立存取。程序员可利用数据寄存器的这种“可分可合”的特性，灵活地处理字/字节的信息。

寄存器ax和al通常称为累加器(accumulator)，用累加器进行的操作需要更少的时间。累加器可用于乘、除、输入/输出等操作。

寄存器bx称为基地址寄存器(base register)，可作为存储器指针使用。

寄存器cx称为计数寄存器(count register)，在循环和字符串操作时，可用它来控制循环次数，在位操作中，当移多位时，要用cl来指明移位的位数。

寄存器dx称为数据寄存器(data register)，在进行乘、除运算时，它可作为默认的操作数参与运算，也可用于存放I/O的端口地址。

在16位cpu中，ax、bx、cx、dx不能作为基址和变址寄存器来存放存储单元的地址，但在32位cpu中，其32位寄存器eax、ebx、ecx、edx不仅可以传送数据、暂存数据保存算术逻辑运算结果，而且也可作为指针寄存器，所以，这些32位寄存器更具通用性。

2.变址寄存器
32位cpu有2个32位通用的寄存器esi和dsi。其低16位对应先前cpu中的si和di，对低16位数据的存取，不影响高16位的数据。

寄存器esi、edi、si和di称为变址寄存器(index register)，它们主要用于存放存储单元在段内的偏移量，用它们可以实现多种存储器操作数的寻址方式，为以不同的地址形式访问存储单元提供方便。

变址寄存器不可分割为8位寄存器。作为通用寄存器，也可存储算术逻辑运算的操作数和运算结果。

3.指针寄存器
32位cpu有2个32位通用寄存器ebp和esp。其低16位对应先前cpu中的sbp和sp，对低16位数据的存取，不影响高16位的数据。

寄存器ebp、esp、bp和sp称为指针寄存器(pointer register)，主要用来存放堆栈内存储单元的偏移量，用它们可实现多种寄存器操作数的寻址方式，可以位不同的地址形式访问存储单元提供方便。

它们主要用于访问堆栈内的存储单元，并做了规定：
bp为基指针(base pointer)寄存器，用来可直接存取堆栈中的数据。

sp为堆栈指针(stack pointer)寄存器，用它只可以访问栈顶。

4.段寄存器
段寄存器时根据内存分段的管理模式而设置的。内存单元的物理地址由段寄存器的值和一个偏移量组合而成的，这样可用两个较少的值合成一个可访问较大物理空间的内存地址。

cpu内部的段寄存器：
cs：
代码段寄存器(code segment register)，值为代码段的段值。
ds：
数据段寄存器(data segment register)，值为数据段的段值。
es：
附加段寄存器(extra segment register)，值为附加数据段的段值。
ss：
堆栈段寄存器(stack segment register)，值为堆栈段段值。
fs：
附加段寄存器(extra segment register)，值为附加数据段的段值。
gs：
附加段寄存器(Extra Segment Register)，其值为附加数据段的段值。

在16位CPU系统中，它只有4个段寄存器，所以，程序在任何时刻至多有4个正在使用的段可直接访问；在32位微机系统中，它有6个段寄存器，所以，在此环境下开发的程序最多可同时访问6个段。

32位CPU有两个不同的工作方式：实模式和保护模式。在每种方式下，段寄存器的作用是不同的。有关规定简单描述如下：

实模式：前4个段寄存器CS、DS、ES和SS与先前CPU中的所对应的段寄存器的含义完全一致，内存单元的逻辑
地址仍为“段值：偏移量”的形式。为访问某内存段内的数据，必须使用该段寄存器和存储单元的偏移量。

保护模式：在此方式下，情况要复杂得多，装入段寄存器的不再是段值，而是称为“选择子”(Selector)的某个值。

5.指令寄存器

32位CPU把指令指针扩展到32位，并记作EIP，EIP的低16位与先前CPU中的IP作用相同。

指令指针EIP、IP(Instruction Pointer)是存放下次将要执行的指令在代码段的偏移量。在具有预取指令功能的系统中，下次要执行的指令通常已被预取到指令队列中，除非发生转移情况。所以，在理解它们的功能时，不考虑存在指令队列的情况。

在实模式下，由于每个段的最大范围为64K，所以，EIP中的高16位肯定都为0，此时，相当于只用其低16位的IP来反映程序中指令的执行次序。

6.标志寄存器
包括运算结果标志位、状态控制标志位、32位标志寄存器增加的标志位等等。

1.3 系统架构

系统架构

地址映射

2 编写代码与分析代码

我们可以参照linux-0.11的bootsect.s中的源代码。

我们可用编写的boot.s源码如下：

.globl begtext, begdata, begbss, endtext, enddata, endbss
.text
begtext:
.data
begdata:
.bss
begbss:
.text

BOOTSEG=0x07c0

entry start
start:
        jmpi go,BOOTSEG

go:
        mov ax,cs
        mov ds,ax
        mov es,ax

        mov ax,#0x0600
        mov cx,#0x0000
        mov dx,#0x0fff
        int 0x10

        mov cx,#20
        mov dx,#0x0000
        mov bx,#0x000c
       mov bp,#msg1
        mov ax,#0x1301
        int 0x10

loop0:  jmp loop0

msg1:   .ascii "loading system..."
        .byte 13,10

.org 510
        .word 0xaa55

.text
endtext:
.data
enddata:
.bss
endbss:

3 编译与运行

a.编译

$ as86 -0 -a -o boot.o boot.s
$ ld86 -0 -s -o boot boot.o

b.制作软盘文件

$ dd bs=32 if=boot of=boot.img skip=1

c.编辑bochsrc文件：

megs:32

romimage:file=/usr/share/bochs/BIOS-bochs-latest
vgaromimage:file=/usr/share/bochs/VGABIOS-lgpl-latest

floppya:1_44=boot.img,status=inserted

boot:floppy

mouse:enabled=0

keyboard:keymap=/usr/share/bochs/keymaps/x11-pc-us.map

d.执行

$ bochs -f bochsrc

4 调试

4.1 基本调试技巧

我们可以利用vim本身自带的查看二进制方法：

$ vim -b boot

然后使用：

:%!xxd -g 1

我们对上面的文件进行分析，可以看到如下图所示：

可执行文件二进制分析

当然，我们也要注意一个小细节，如下图所示：

生成的文件内容

我们要计算一下，0x210+16 = 544。也就是说，生成的文件是544字节的。比我们需要生成的512字节多了32字节。整个呢，就是minix可执行文件的头结构。

5 补充知识

5.1 软盘

若使用3.5寸的软盘，则分为上下两面，每面分为80个磁道，每个磁道分为18个扇区，而一个扇区就是512字节。
因此，计算其大小为：

2*80*18*512/1024.0 = 1440.0KB = 1.44MB

软盘需要软驱对其进行读写操作。软驱的主要组成有：控制电路板、马达、磁头定位器和磁头。磁头其实是很小的，上下各有一个，我们看到的是它的滑轨。

三.编写简单的汇编启动程序
1 汇编启动程序这部分主要是用来学习linux-0.11，做预前汇编准备工作。同时也是一个启动程序，用来引导操作...
嵌入式学习笔记之用C语言点亮一个LED
硬件连接请查看前一篇文章目录 C指针复习写C程序汇编编写启动程序 1.C指针复习 int *...
《编码》24章高级语言与低级语言 18/71天阅读
使用汇编语言编写程序要比使用机器语言简单得多，但微处理器并不能解释汇编语言。使用汇编器将源文件汇编成机器指令。 ...
单片机STM32的启动文件详解--学习笔记
启动文件简介启动文件由汇编编写，是系统上电复位后第一个执行的程序。主要做了以下工作： 1、初始化堆栈指针SP=_...
CSAPP复习（1月24日）
第三章程序的机器级表示 1 有关汇编用高级语言编写的程序可以在很多不同的机器上编译和执行，而汇编代码则是与特...
七.第一个程序
汇编程序的步骤：1.编写代码2.编译，链接3.调试运行 debug模式下的数组是16进制，但是我们在编写汇编程序的...
编写完整的汇编程序
第一个完整的汇编程序前面的实验都是利用Debug程序进行模拟测试的，并没有编写一个完整的汇编程序使用汇编语言编...
jvm性能调优-1
1，根据cpu查找线上程序出现的问题展现问题编写程序启动程序打包启动程序java -jar xxx.ja...
通过汇编一个简单的C程序，分析汇编代码理解计算机是如何工作的
实验：首先，写一个简单的c程序通过命令编译c程序为汇编代码打开汇编代码简化汇编代码假设目前栈底位置为10...
汇编语言 | 04 - 开始编程
本章学习目标，编写完整的汇编语言程序，用编译器再将汇编程序编译成可执行文件（如 .exe 文件），进而在操作系统中...