美文网首页
1. 系统启动

1. 系统启动

作者: 西山薄凉 | 来源:发表于2020-03-29 22:59 被阅读0次

    0.X86架构


    image.png

    1.BIOS引导

    • 实模式只有 1MB 内存寻址空间(X86)
    • 加电, 重置 CS 为 0xFFFF , IP 为 0x0000, 对应 BIOS 程序
    • 0xF0000-0xFFFFF 映射到 BIOS 程序(存储在ROM中), BIOS 做以下三件事:
      • 检查硬件
      • 提供基本输入(中断)输出(显存映射)服务
      • 加载 MBR 到内存(0x7c00)
    • MBR: 启动盘主引导扇区扇区(512B, 由 Grub2 写入 boot.img 镜像)
    • boot.img 加载 Grub2 的 core.img 镜像
    • core.img 包括 diskroot.img, lzma_decompress.img, kernel.img 以及其他模块
    • boot.img 先加载运行 diskroot.img, 再由 diskroot.img 加载 core.img 的其他内容
    • diskroot.img 解压运行 lzma_compress.img, 由lzma_compress.img 切换到保护模式
    • 切换到保护模式需要做以下三件事:
      • 启用分段, 辅助进程管理
      • 启动分页, 辅助内存管理
      • 打开其他地址线
    • lzma_compress.img 解压运行 grub 内核 kernel.img, kernel.img 做以下四件事:
      • 解析 grub.conf 文件
      • 选择操作系统
      • 例如选择 linux16, 会先读取内核头部数据进行检查, 检查通过后加载完整系统内核
      • 启动系统内核

    2.内核初始化

    • 内核初始化, 运行 start_kernel() 函数(位于 init/main.c), 初始化做三件事
      • 创建样板进程, 及各个模块初始化
      • 创建管理/创建用户态进程的进程
      • 创建管理/创建内核态进程的进程

    • 创建样板进程,及各个模块初始化
      • 创建第一个进程, 0号进程. set_task_stack_end_magic(&init_task) and struct task_struct init_task = INIT_TASK(init_task)
      • 初始化中断, trap_init(). 系统调用也是通过发送中断进行, 由 set_system_intr_gate() 完成.
      • 初始化内存管理模块, mm_init()
      • 初始化进程调度模块, sched_init()
      • 初始化基于内存的文件系统 rootfs, vfs_caches_init()
        • VFS(虚拟文件系统)将各种文件系统抽象成统一接口
      • 调用 rest_init() 完成其他初始化工作
    • 创建管理/创建用户态进程的进程, 1号进程
      • rest_init() 通过 kernel_thread(kernel_init,...) 创建 1号进程(工作在用户态).
      • 权限管理
        • x86 提供 4个 Ring 分层权限
        • 操作系统利用: Ring0-内核态(访问核心资源); Ring3-用户态(普通程序)
      • 用户态调用系统调用: 用户态-系统调用-保存寄存器-内核态执行系统调用-恢复寄存器-返回用户态
      • 新进程执行 kernel_init 函数, 先运行 ramdisk 的 /init 程序(位于内存中)
        • 首先加载 ELF 文件
        • 设置用于保存用户态寄存器的结构体
        • 返回进入用户态
        • /init 加载存储设备的驱动
      • kernel_init 函数启动存储设备文件系统上的 init

    • 创建管理/创建内核态进程的进程, 2号进程
      • rest_init() 通过 kernel_thread(kthreadd,...) 创建 2号进程(工作在内核态).
      • kthreadd 负责所有内核态线程的调度和管理

    3.系统调用

    • glibc 将系统调用封装成更友好的接口
    • 本节解析 glibc 函数如何调用到内核的 open

    • 用户进程调用 open 函数
      • glibc 的 syscal.list 列出 glibc 函数对应的系统调用
      • glibc 的脚本 make_syscall.sh 根据 syscal.list 生成对应的宏定义(函数映射到系统调用)
      • glibc 的 syscal-template.S 使用这些宏, 定义了系统调用的调用方式(也是通过宏)
      • 其中会调用 DO_CALL (也是一个宏), 32位与 64位实现不同

    • 32位 DO_CALL (位于 i386 目录下 sysdep.h)
      • 将调用参数放入寄存器中, 由系统调用名得到系统调用号, 放入 eax
      • 执行 ENTER_KERNEL(一个宏), 对应 int $0x80 触发软中断, 进入内核
      • 调用软中断处理函数 entry_INT80_32(内核启动时, 由 trap_init() 配置)
      • entry_INT80_32 将用户态寄存器存入 pt_regs 中(保存现场以及系统调用参数), 调用 do_syscall_32_iraq_on
      • do_syscall_32_iraq_on 从 pt_regs 中取系统调用号(eax), 从系统调用表得到对应实现函数, 取 pt_regs 中存储的参数, 调用系统调用
      • entry_INT80_32 调用 INTERRUPT_RUTURN(一个宏)对应 iret 指令, 系统调用结果存在 pt_regs 的 eax 位置, 根据 pt_regs 恢复用户态进程
    • 64位 DO_CALL (位于 x86_64 目录下 sysdep.h)
      • 通过系统调用名得到系统调用号, 存入 rax; 不同中断, 执行 syscall 指令
      • MSR(特殊模块寄存器), 辅助完成某些功能(包括系统调用)
      • trap_init() 会调用 cpu_init->syscall_init 设置该寄存器
      • syscall 从 MSR 寄存器中, 拿出函数地址进行调用, 即调用 entry_SYSCALL_64
      • entry_SYSCALL_64 先保存用户态寄存器到 pt_regs 中
      • 调用 entry_SYSCALL64_slow_pat->do_syscall_64
      • do_syscall_64 从 rax 取系统调用号, 从系统调用表得到对应实现函数, 取 pt_regs 中存储的参数, 调用系统调用
      • 返回执行 USERGS_SYSRET64(一个宏), 对应执行 swapgs 和 sysretq 指令; 系统调用结果存在 pt_regs 的 ax 位置, 根据 pt_regs 恢复用户态进程

    • 系统调用表 sys_call_table
      • 32位 定义在 arch/x86/entry/syscalls/syscall_32.tbl
      • 64位 定义在 arch/x86/entry/syscalls/syscall_64.tbl
      • syscall_*.tbl 内容包括: 系统调用号, 系统调用名, 内核实现函数名(以 sys 开头)
      • 内核实现函数的声明: include/linux/syscall.h
      • 内核实现函数的实现: 某个 .c 文件, 例如 sys_open 的实现在 fs/open.c
        • .c 文件中, 以宏的方式替代函数名, 用多层宏构建函数头
      • 编译过程中, 通过 syscall_.tbl 生成 unistd_.h 文件
        • unistd_*.h 包含系统调用与实现函数的对应关系
      • syscall_.h include 了 unistd_.h 头文件, 并定义了系统调用表(数组)
    image.png

    相关文章

      网友评论

          本文标题:1. 系统启动

          本文链接:https://www.haomeiwen.com/subject/eevpuhtx.html