做了几天时间的这个教程,现在来总结一下我的收获
操作系统启动过程
因为这个系列有一个特点就是不使用grub这样的存在的bootloader,那么你就需要自己去手写引导
现在我们来梳理一下计算机启动的整个过程发生了什么?
-
点击电源键,主板通电,CPU初始化(寄存器初始化,主要是CS,IP),这两个寄存器关系着CPU执行的第一个指令,
而这个指令指向的地址就是BIOS的程序入口 (jump post)
-
而BIOS又会进行开机自检,检查硬件是否存在,是否有问题,如果出现问题,会发出蜂鸣声,没问题则会向屏幕打印硬件信息,而在开机自检之后,BIOS还会检查是否存在Bootable device,如何区分他是不是Bootable呢?
这里就涉及到了MBR和boot sector
讲道理,BIOS会去检查每个设备的前512字节,并且在512字节的末尾,会有一个magic number : 0xaaff(好像是)
如果是,他就会认为他是bootable device,而这512字节一般来说存放的都是MBR(main boot record),而其实就我的理解,MBR的存在呢,主要是为了解决一个问题:硬盘的每个分区都可以装一个系统,MBR中存放的就是分区表和代码,代码呢,可能就是bootloader
而在我们的这个教程中,就没有是使用MBR,因为他只是一个在虚拟机上模拟的一个简单系统,所以他使用了boot sector启动
接着刚才说:
而CPU会把这512字节的内容读到内存中:0x7c00处,然后开始执行MBR或者boot sector的代码
-
而boot sector接着要干什么呢?
加载内核,但是这里我们就又要说一下实模式和保护模式了
Intel8086的CPU是16位的,那也就代表着,我们可以使用的空间只有2的16次个bits,也就是8KB左右吧,但是8086设计时的目标是使用1MB的内存,于是他就是用了一种分段的寻址方式,段地址偏移4位+逻辑地址,这样就实现了20位的寻址,也就勉强达到了1MB的内容
但是后面的几代CPU为了兼容8086,他们就将8086的这种启动方式作为实模式:
- 16位寻址
- 使用分段的方法
- 只能使用单个CPU
- 没有内存保护
但是,根据我们尝试来说,这所谓的1MB内存根本不足以让我们把内核加载进来,而且后面的几代CPU从32位进步到64位,继续使用16位的寻址未免太low,于是对应实模式,就有了保护模式(32位)
- 32位寻址
- 使用GDT,而不是简单的分段
- 有了段的权限控制
- 有了内存保护
- 可以使用多个CPU
- 有了更大的内存空间
-
内核加载完成后,会初始化寄存器,因为从16位进入32位,寄存器也需要重新初始化,并且要创建一些重要的进程
-
加载操作系统的其他部分,文件系统,网络....
其实,操作系统不见得都是在保护模式下进行加载的,比如linux,他使用了一种叫做unreal mode的模式,所谓的unreal其实也就是在real和protect之间反复横跳来加载内核
而且,linux为了减小内核大小,还采用了一般压缩,一半不压缩的骚操作,没压缩的一半会去解压另一半
其他
其实,总的来说,这一系列下来收获还是蛮大的
比如说:
- GDT是怎么被加载到内存,又是怎么被CPU找到的
- GDT为什么结构那么复杂
- 如何配置交叉编译的环境
- 汇编的一些知识
- 段错误和GDT有什么关系
- 实模式如何进入保护模式
- 以及CPU寻址
- 堆栈是怎么分配的
- ......
网友评论