汇编

作者: 爱笑的眼睛super | 来源:发表于2021-04-01 15:45 被阅读0次

    一、编译过程

    程序的本质:执行过程

    程序在硬盘(010101)->双击->装载进内存


    编译

    寄存器与内存:

    • 通常,CPU会先将内存中的数据存储到寄存器中,然后再对寄存器中的数据进行运算
    • 假设内存中有块红色内存空间的值是3,现在想把它的值加1,并将结果存储到黄色内存空间
    • CPU首先会将红色内存空间的值放到rax寄存器中:
      movq 红色内存空间, %rax
    • 然后让rax寄存器与1相加:
      addq $0x1, %rax
    • 最后将值赋值给内存空间:
      movq %rax, 黄色内存空间
    寄存器与内存

    编程语言的发展:

    发展

    汇编语言和机器语言一一对应,每一条机器指令都有与之对应的汇编指令
    汇编可以通过编译得到机器语言,机器语言可以通过反汇编得到汇编语言
    高级语言可以通过编译得到汇编语言\机器语言,但汇编语言\机器语言机会不可能还原成高级语言

    二、汇编基本语法

    汇编的种类

    • 8086汇编(16bit)
    • x86汇编 (32bit)
    • x64汇编 (64bit)
    • ARM汇编(嵌入式、移动设备)
      ...

    x86、x64汇编根据编译器的不同,有2种书写格式

    • Intel: Windows派系
    • AT&T :Unix派系

    作为iOS开发工程师,最主要的汇编语言是

    • AT&T汇编 -> iOS模拟器
    • ARM汇编 -> iOS真机设备

    常见的汇编指令

    项目 AT&T 说明
    寄存器命名 %rax AT&T寄存器前加%
    操作数顺序 movq %rax, %rdx 将rax的值赋值给rdx
    常数\立即 数 movq $3, %rax 将3赋值给rax
    常数\立即 数 movq $0x10, %rax 将0x10赋值给rax
    内存赋值 movq $0xa, 0x1ff7(%rip) 将0xa赋值给地址为rip + 0x1ff7的内存空间
    取内存地址 leaq -0x18(%rbp), %rax 将rbp – 0x18这个地址值赋值给rax
    jmp指令 jmp *%rdx call和jmp写法类似
    jmp 0x4001002
    jmp *(%rax)
    操作数长度 movl %eax, %edx l = long (32-bit integer or 64-bit floating point)
    操作数长度 movb $0x10, %al b = byte (8-bit)
    操作数长度 leaw 0x10(%dx), %ax w = word (16-bit)
    s = short (16-bit integer or 32-bit floating point)
    q = quad (64 bit)

    JMP 无条件转移指令
    CALL 过程调用 常常伴随着retq 返回

    寄存器

    有16个常用寄存器
    • rax、rbx、rcx 、rdx、rsi、rdi、rbp、rsp
    • r8、r9、r10、r11、r12、r13、r14、r15
    寄存器的具体用途
    • rax、rdx常作为函数返回值使用
    • rdi、rsi、rdx、rcx、r8、r9等寄存器常用于存放函数参数
    • rsp、rbp用于栈操作
    • rip作为指令指针
      :存储着CPU下一条要执行的指令的地址
      :一旦CPU读取一条指令,rip会自动指向下一条指令(存储下一条指令的地址)
    寄存器的发展过程
    64位x86处理器的寄存器.png

    64和32位的差异是:
    64位有16个寄存器,32位只有8个。但是32位前8个都有不同的命名,分别是e开头,而64位前8个使用了r代替e。e开头的寄存器命名依然可以直接运用于相应寄存器的低32位。而剩下的寄存器名则是从r8 - r15,其低位分别用d,w,b指定长度。
    32位使用栈帧来作为传递的参数的保存位置,而64位使用寄存器,分别用rdi,rsi,rdx,rcx,r8,r9作为第1-6个参数。rax作为返回值

    三、lldb常用指令

    读取寄存器的值
    • register read/格式
    • register read/x
    修改寄存器的值
    • register write 寄存器名称 数值
    • register write rax 0
    读取内存中的值
    • x/数量-格式-字节大小 内存地址
    • x/3xw 0x0000010
    修改内存中的值
    • memory write 内存地址 数值
    • memory write 0x0000010 10
    格式
    • x是16进制,f是浮点,d是十进制
    字节大小
    • b – byte 1字节
    • h – half word 2字节
    • w – word 4字节
    • g – giant word 8字节
    expression 表达式
    • 可以简写:expr 表达式
    • expression $rax
    • expression $rax = 1
    po 表达式
    • print 表达式
    • po/x $rax
    • po (int)$rax

    lldb常用调试指令

    • thread step-over、next、n
      单步运⾏行行,把子函数当做整体⼀一步执⾏行行(源码级别)

    • thread step-in、step、s
      单步运⾏行行,遇到子函数会进⼊入子函数(源码级别)

    • thread step-inst-over、nexti、ni
      单步运⾏行行,把子函数当做整体⼀一步执⾏行行(汇编级别)

    • thread step-inst、stepi、si
      单步运⾏行行,遇到子函数会进⼊入子函数(汇编级别)

    • thread step-out、finish
      直接执⾏行行完当前函数的所有代码,返回到上一个函数(遇到断点会卡住)

    四、规律

    • 内存地址格式为:0x4bdc(%rip),一般是全局变量,全局区(数据段)
    • 内存地址格式为:-0x78(%rbp),一般是局部变量,栈空间
    • 内存地址格式为:0x10(%rax),一般是堆空间

    五、汇编看闭包的本质

    step1:证明堆空间里存放着num的值

    先看一下没有捕获外部变量这段代码


    代码1.png
    对应的汇编代码.png

    这两个指令的区别:
    leaq rip+0x15 rax : 将rip+0x15这个地址给rax
    movq rip+0x15 rax : 将rip+0x15这个地址里内容的前8个字节给rax

    再看一下这个闭包的代码


    代码2.png
    对应的汇编代码.png

    0x100001b81 <+33>: callq 0x10000724e ; symbol stub for: swift_allocObject

    libswiftCore.dylib`swift_allocObject:
    0x7fff7241dd22 <+34>: callq 0x7fff7241dc90 ; swift_slowAlloc

    libswiftCore.dylib`swift_slowAlloc:

    0x7fff7241dca4 <+20>: callq 0x7fff7249a28c ; symbol stub for: malloc
    libsystem_malloc.dylib`malloc:
    0x7fff72cb7cf0 <+16>: callq 0x7fff72cb7d12 ; malloc_zone_malloc

    (lldb) register read rax
    rax = 0x000000010062ab90

    (lldb) x/5xg 0x000000010062ab90
    0x10062ab90: 0x0000000100008150 0x0000000000000002
    0x10062aba0: 0x0000000000000000 0x0000000100000000
    0x10062abb0: 0x0000000000000000

    (lldb) x/5xg 0x000000010062ab90
    0x10062ab90: 0x0000000100008150 0x0000000200000002
    0x10062aba0: 0x0000000000000001 0x0000000100000000
    0x10062abb0: 0x0000000000000000

    (lldb) x/5xg 0x000000010062ab90
    0x10062ab90: 0x0000000100008150 0x0000000200000002
    0x10062aba0: 0x0000000000000009 0x0000000100000000
    0x10062abb0: 0x0000000000000000

    先看一个例子
    猜测swift_allocObject(size_t : size)至少要接收一个参数size,所以找参数,前面也有说过,一般rdi、rsi、rdx、rcx、r8、r9等寄存器常用语存放函数参数
    目测这个代码最像,这个参数是告诉堆空间我需要24个字节,但是堆空间的规则分配内存是16的倍数

    step2:那么到底分配了多少堆空间的内存呢?fn里放了些什么?

    swift_allocObject参数.png
    代码3
    sum函数地址
    汇编代码

    计算rip+0xaa4d
    和rip+0xaa4a
    发现是连续的16个字节,那么fn里前8个字节放的是函数地址,后8个字节放的是0

    那么如果捕获外部变量num呢?fn里又放了什么?
    根据上面的经验,我们可以知道,我们只需要搞清楚rax,和rdx里放的什么东西,就知道getFn返回的是什么,也就是fn里究竟放了什么

    我们来看一下fn这个闭包里放的什么东西呢?
    我们在plus这个打个断点,之前说过,一般rax和rdx寄存器放返回值,所有我们看一下rax和rdx放的什么东西?


    getFn()

    综上所述 我们知道了getFn返回的也就是fn里存放了plus的函数地址和堆空间地址值

    step3:plus怎么访问堆空间的num

    callq *%rax

    fn(1)
    fn(8)
    我们之前说过,一般参数是放到di、rsi、rdx、rcx、r8、r9等这个寄存器里,所以看
    move $0x8 %edi
    plus(i, heap num堆控件的地址值) // rdx+0x10

    plus参数.png

    rdi->1
    r13->rsi->堆空间地址值


    addq

    add 0x10(%rdx), %rcx
    rcx = num + rcx

    rcx送回num地址里

    附:


    附1 附2

    相关文章

      网友评论

          本文标题:汇编

          本文链接:https://www.haomeiwen.com/subject/mwqqhltx.html