美文网首页
三.编写简单的汇编启动程序

三.编写简单的汇编启动程序

作者: wit_yuan | 来源:发表于2017-11-27 16:48 被阅读0次

    1 汇编启动程序

    这部分主要是用来学习linux-0.11,做预前汇编准备工作。同时也是一个启动程序,用来引导操作系统代码。

    1.1 工具

    1.bin86,所以我们使用的是as86汇编语言。可以使用:

    $ sudo apt-get intall bin86
    

    安装软件工具。然后可以使用:

    $ man 1 as86
    

    查询相应的汇编代码。

    这只是一个boot部分的代码,使用的是as86汇编器,ld86链接器,而如果我们要加载head的代码,则需要使用GNU的gas汇编器,用GNU ld链接。

    需要知道,目前这部分的boot代码,对于整个bios来说,只有512B,也就是说,启动整个linux系统,还需要第二部分的代码,也就是loader代码,之后才是Linux代码。

    对于loader代码,比较有名的有Lilo,Grub和spfdisk等。

    注意事项

    as86汇编器对于boot.s程序编译时生成boot.o目标文件,再用ld86进行链接操作,生成MINIX结构的可执行文件,但在Linux中用作引导时需要去除其MINIX文件头结构。

    2.GNU as工具

    as汇编语言语法和intel的汇编语言有很大不同,被称为AT&T语法,最主要的区别是以下几点:

    a. AT&T语法立即操作数前面加”$”,而寄存器操作数前面要加%与程序计数器相关的语句操作数前面要加*,intel没有限制。
    b. AT&T语法的源操作数和目的操作数与intel的位置正好相反,它是源在前,目的在后。
    c. AT&T语法中内存操作数的长度由操作码的最后一个字符决定比如b for byte, w for word, l for long,
    Intel则通过前缀区分比如Intel的是mov al,byte ptr foo,而AT&T中是movb foo,%al 。
    d. AT&T不提供对多代码段的支持,UNIX类操作系统要求所有代码在一个段中。
    

    1.2 基础知识

    默认的引导代码会放在软盘的引导扇区,也就是软盘的头512个字节位置。而bios会将这部分代码读取出来, 放到内存的0x7c00:0x0处。因此,我们的代码运行地址都是基于0x7c00的。

    intel架构下的寄存器

    只列出关键的一些寄存器:

    8个数据寄存器:EAX、EBX、ECX、EDX
    2个变址寄存器:ESI、EDI  
    2个指针寄存器:ESP、EBP
    1个标志寄存器:EFLAGS
    6个段寄存器:CS、DS、ES、FS、GS、SS
    

    1.数据寄存器
    32位CPU有4个32位的通用寄存器eax、ebx、ecx和edx。对低16位数据的存取,不会影响高16位的数据。这些低16位寄存器分别命名为:ax、bx、cx和dx,它和先前的CPU中的寄存器相一致。
    4个16位寄存器又可分割成8个独立的8位寄存器(ax:ah-al、bx:bh-bl、cx:ch-cl、dx:dh-dl),每个寄存器都有自己的名称,可独立存取。程序员可利用数据寄存器的这种“可分可合”的特性,灵活地处理字/字节的信息。

    寄存器ax和al通常称为累加器(accumulator),用累加器进行的操作需要更少的时间。累加器可用于乘、除、输入/输出等操作。

    寄存器bx称为基地址寄存器(base register),可作为存储器指针使用。

    寄存器cx称为计数寄存器(count register),在循环和字符串操作时,可用它来控制循环次数,在位操作中,当移多位时,要用cl来指明移位的位数。

    寄存器dx称为数据寄存器(data register),在进行乘、除运算时,它可作为默认的操作数参与运算,也可用于存放I/O的端口地址。

    在16位cpu中,ax、bx、cx、dx不能作为基址和变址寄存器来存放存储单元的地址,但在32位cpu中,其32位寄存器eax、ebx、ecx、edx不仅可以传送数据、暂存数据保存算术逻辑运算结果,而且也可作为指针寄存器,所以,这些32位寄存器更具通用性。

    2.变址寄存器
    32位cpu有2个32位通用的寄存器esi和dsi。其低16位对应先前cpu中的si和di,对低16位数据的存取,不影响高16位的数据。

    寄存器esi、edi、si和di称为变址寄存器(index register),它们主要用于存放存储单元在段内的偏移量,用它们可以实现多种存储器操作数的寻址方式,为以不同的地址形式访问存储单元提供方便。

    变址寄存器不可分割为8位寄存器。作为通用寄存器,也可存储算术逻辑运算的操作数和运算结果。

    3.指针寄存器
    32位cpu有2个32位通用寄存器ebp和esp。其低16位对应先前cpu中的sbp和sp,对低16位数据的存取,不影响高16位的数据。

    寄存器ebp、esp、bp和sp称为指针寄存器(pointer register),主要用来存放堆栈内存储单元的偏移量,用它们可实现多种寄存器操作数的寻址方式,可以位不同的地址形式访问存储单元提供方便。

    它们主要用于访问堆栈内的存储单元,并做了规定:
    bp为基指针(base pointer)寄存器,用来可直接存取堆栈中的数据。

    sp为堆栈指针(stack pointer)寄存器,用它只可以访问栈顶。

    4.段寄存器
    段寄存器时根据内存分段的管理模式而设置的。内存单元的物理地址由段寄存器的值和一个偏移量组合而成的,这样可用两个较少的值合成一个可访问较大物理空间的内存地址。

    cpu内部的段寄存器:
    cs:
    代码段寄存器(code segment register),值为代码段的段值。
    ds:
    数据段寄存器(data segment register),值为数据段的段值。
    es:
    附加段寄存器(extra segment register),值为附加数据段的段值。
    ss:
    堆栈段寄存器(stack segment register),值为堆栈段段值。
    fs:
    附加段寄存器(extra segment register),值为附加数据段的段值。
    gs:
    附加段寄存器(Extra Segment Register),其值为附加数据段的段值。

    在16位CPU系统中,它只有4个段寄存器,所以,程序在任何时刻至多有4个正在使用的段可直接访问;在32位微机系统中,它有6个段寄存器,所以,在此环境下开发的程序最多可同时访问6个段。

    32位CPU有两个不同的工作方式:实模式和保护模式。在每种方式下,段寄存器的作用是不同的。有关规定简单描述如下:

    实模式: 前4个段寄存器CS、DS、ES和SS与先前CPU中的所对应的段寄存器的含义完全一致,内存单元的逻辑
    地址仍为“段值:偏移量”的形式。为访问某内存段内的数据,必须使用该段寄存器和存储单元的偏移量。

    保护模式: 在此方式下,情况要复杂得多,装入段寄存器的不再是段值,而是称为“选择子”(Selector)的某个值。

    5.指令寄存器

    32位CPU把指令指针扩展到32位,并记作EIP,EIP的低16位与先前CPU中的IP作用相同。

    指令指针EIP、IP(Instruction Pointer)是存放下次将要执行的指令在代码段的偏移量。在具有预取指令功能的系统中,下次要执行的指令通常已被预取到指令队列中,除非发生转移情况。所以,在理解它们的功能时,不考虑存在指令队列的情况。

    在实模式下,由于每个段的最大范围为64K,所以,EIP中的高16位肯定都为0,此时,相当于只用其低16位的IP来反映程序中指令的执行次序。

    6.标志寄存器
    包括运算结果标志位、状态控制标志位、32位标志寄存器增加的标志位等等。

    1.3 系统架构

    系统架构 地址映射

    2 编写代码与分析代码

    我们可以参照linux-0.11的bootsect.s中的源代码。

    我们可用编写的boot.s源码如下:

    .globl begtext, begdata, begbss, endtext, enddata, endbss
    .text
    begtext:
    .data
    begdata:
    .bss
    begbss:
    .text
    
    BOOTSEG=0x07c0
    
    entry start
    start:
            jmpi go,BOOTSEG
    
    go:
            mov ax,cs
            mov ds,ax
            mov es,ax
    
            mov ax,#0x0600
            mov cx,#0x0000
            mov dx,#0x0fff
            int 0x10
    
            mov cx,#20
            mov dx,#0x0000
            mov bx,#0x000c
           mov bp,#msg1
            mov ax,#0x1301
            int 0x10
    
    loop0:  jmp loop0
    
    msg1:   .ascii "loading system..."
            .byte 13,10
    
    .org 510
            .word 0xaa55
    
    .text
    endtext:
    .data
    enddata:
    .bss
    endbss:
    
    

    3 编译与运行

    a.编译

    $ as86 -0 -a -o boot.o boot.s
    $ ld86 -0 -s -o boot boot.o
    

    b.制作软盘文件

    $ dd bs=32 if=boot of=boot.img skip=1
    

    c.编辑bochsrc文件:

    megs:32
    
    romimage:file=/usr/share/bochs/BIOS-bochs-latest
    vgaromimage:file=/usr/share/bochs/VGABIOS-lgpl-latest
    
    floppya:1_44=boot.img,status=inserted
    
    boot:floppy
    
    mouse:enabled=0
    
    keyboard:keymap=/usr/share/bochs/keymaps/x11-pc-us.map
    

    d.执行

    $ bochs -f bochsrc
    

    4 调试

    4.1 基本调试技巧

    我们可以利用vim本身自带的查看二进制方法:

    $ vim -b boot
    

    然后使用:

    :%!xxd -g 1
    

    我们对上面的文件进行分析,可以看到如下图所示:


    可执行文件二进制分析

    当然,我们也要注意一个小细节,如下图所示:


    生成的文件内容

    我们要计算一下,0x210+16 = 544。也就是说,生成的文件是544字节的。比我们需要生成的512字节多了32字节。整个呢,就是minix可执行文件的头结构。

    5 补充知识

    5.1 软盘

    若使用3.5寸的软盘,则分为上下两面,每面分为80个磁道,每个磁道分为18个扇区,而一个扇区就是512字节。
    因此,计算其大小为:

    2*80*18*512/1024.0 = 1440.0KB = 1.44MB
    

    软盘需要软驱对其进行读写操作。软驱的主要组成有:控制电路板、马达、磁头定位器和磁头。磁头其实是很小的,上下各有一个,我们看到的是它的滑轨。

    相关文章

      网友评论

          本文标题:三.编写简单的汇编启动程序

          本文链接:https://www.haomeiwen.com/subject/rscdbxtx.html