美文网首页iOS逆向工程
逆向学习笔记3——寄存器与汇编指令

逆向学习笔记3——寄存器与汇编指令

作者: 危险地带_浅笑 | 来源:发表于2018-04-27 16:36 被阅读31次

    CPU包括控制器、运算器、寄存器。其中寄存器的作用就是进行数据的临时存储。

    CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

    对于arm64系的CPU来说, 如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。

    高速缓存

    iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB,2级缓存的容量8M.

    CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成).CPU直接从高速缓存依次读取指令来执行.

    寄存器

    内部部件之间由总线连接

    image.png
    • 对程序员来说,CPU中最主要部件是寄存器,可以通过改变寄存器的内容来实现对CPU的控制
    • 不同的CPU,寄存器的个数、结构是不相同的

    通用寄存器

    • ARM64拥有有31个64位的通用寄存器 x0 到 x30,这些寄存器通常用来存放一般性的数据,称为通用寄存器(有时也有特定用途)

      • 那么w0 到 w28 这些是32位的. 因为64位CPU可以兼容32位.所以可以只使用64位寄存器的低32位.
      • 比如 w0 就是 x0的低32位!
      image.png
    • 通常,CPU会先将内存中的数据存储到通用寄存器中,然后再对通用寄存器中的数据进行运算
    • 假设内存中有块红色内存空间的值是3,现在想把它的值加1,并将结果存储到蓝色内存空间


      image.png
    • CPU首先会将红色内存空间的值放到X0寄存器中:mov X0,红色内存空间
    • 然后让X0寄存器与1相加:add X0,1
    • 最后将值赋值给内存空间:mov 蓝色内存空间,X0

    pc寄存器(program counter)

    • 为指令指针寄存器,它指示了CPU当前要读取指令的地址


      image.png
      image.png
    • 在内存或者磁盘上,指令和数据没有任何区别,都是二进制信息
    • CPU在工作的时候把有的信息看做指令,有的信息看做数据,为同样的信息赋予了不同的意义
      • 比如 1110 0000 0000 0011 0000 1000 1010 1010
      • 可以当做数据 0xE003008AA
      • 也可以当做指令 mov x0, x8
    • CPU根据什么将内存中的信息看做指令?
      • CPU将pc指向的内存单元的内容看做指令
      • 如果内存中的某段内容曾被CPU执行过,那么它所在的内存单元必然被pc指向过

    • 栈:是一种具有特殊的访问方式的存储空间(后进先出, Last In Out Firt,LIFO)


      image.png
      image.png

    SP和FP寄存器

    • sp寄存器在任意时刻会保存我们栈顶的地址.
    • fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!()

    注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
    ARM64里面 对栈的操作是16字节对齐的!!

    状态寄存器

       CPU内部的寄存器中,有一种特殊的寄存器(对于不同的处理器,个数和结构都可能不同).这种寄存器在ARM中,被称为状态寄存器就是CPSR(current program status register)寄存器
    CPSR和其他寄存器不一样,其他寄存器是用来存放数据的,都是整个寄存器具有一个含义.而CPSR寄存器是按位起作用的,也就是说,它的每一位都有专门的含义,记录特定的信息.

    注:CPSR寄存器是32位的

    • CPSR的低8位(包括I、F、T和M[4:0])称为控制位,程序无法修改,除非CPU运行于特权模式下,程序才能修改控制位!
    • N、Z、C、V均为条件码标志位。它们的内容可被算术或逻辑运算的结果所改变,并且可以决定某条指令是否被执行!意义重大!
    image.png

    N(Negative)标志

    CPSR的第31位是 N,符号标志位。它记录相关指令执行后,其结果是否为负.如果为负 N = 1,如果是非负数 N = 0.

       注意,在ARM64的指令集中,有的指令的执行时影响状态寄存器的,比如add\sub\or等,他们大都是运算指令(进行逻辑或算数运算);

    Z(Zero)标志

    CPSR的第30位是Z,0标志位。它记录相关指令执行后,其结果是否为0.如果结果为0.那么Z = 1.如果结果不为0,那么Z = 0.

       对于Z的值,我们可以这样来看,Z标记相关指令的计算结果是否为0,如果为0,则N要记录下"是0"这样的肯定信息.在计算机中1表示逻辑真,表示肯定.所以当结果为0的时候Z = 1,表示"结果是0".如果结果不为0,则Z要记录下"不是0"这样的否定信息.在计算机中0表示逻辑假,表示否定,所以当结果不为0的时候Z = 0,表示"结果不为0"。

    C(Carry)标志

    CPSR的第29位是C,进位标志位。一般情况下,进行无符号数的运算。
    加法运算:当运算结果产生了进位时(无符号数溢出),C=1,否则C=0。
    减法运算(包括CMP):当运算时产生了借位时(无符号数溢出),C=0,否则C=1。

       对于位数为N的无符号数来说,其对应的二进制信息的最高位,即第N - 1位,就是它的最高有效位,而假想存在的第N位,就是相对于最高有效位的更高位。如下图所示:

    image.png

    进位

       我们知道,当两个数据相加的时候,有可能产生从最高有效位向更高位的进位。比如两个32位数据:0xaaaaaaaa + 0xaaaaaaaa,将产生进位。由于这个进位值在32位中无法保存,我们就只是简单的说这个进位值丢失了。其实CPU在运算的时候,并不丢弃这个进位制,而是记录在一个特殊的寄存器的某一位上。ARM下就用C位来记录这个进位值。比如,下面的指令

    mov w0,#0xaaaaaaaa;0xa 的二进制是 1010
    adds w0,w0,w0; 执行后 相当于 1010 << 1 进位1(无符号溢出) 所以C标记 为 1
    adds w0,w0,w0; 执行后 相当于 0101 << 1 进位0(无符号没溢出) 所以C标记 为 0
    adds w0,w0,w0; 重复上面操作
    adds w0,w0,w0
    

    借位

       当两个数据做减法的时候,有可能向更高位借位。再比如,两个32位数据:0x00000000 - 0x000000ff,将产生借位,借位后,相当于计算0x100000000 - 0x000000ff。得到0xffffff01 这个值。由于借了一位,所以C位 用来标记借位。C = 0.比如下面指令:

    "mov w0,#0x7fffffff\n"             //寄存器 cpsr = 0x60000000     0110
    "adds w0,w0,#0x2\n"             //寄存器 cpsr  = 0x90000000     1001
    "mov w0,#0x80000000\n"     //寄存器 cpsr  =0x90000000      1001
    "subs w0,w0,#0x2\n"            //寄存器 cpsr   = 0x30000000     0011
    

    V(Overflow)溢出标志

    CPSR的第28位是V,溢出标志位。在进行有符号数运算的时候,如果超过了机器所能标识的范围,称为溢出。

    • 正数 + 正数 为负数 溢出
    • 负数 + 负数 为正数 溢出
    • 正数 + 负数 不可能溢出

    关于内存读写指令

    注意:读/写 数据是都是往高地址读/写

    str(store register)指令

    将数据从寄存器中读出来,存到内存中.

    ldr(load register)指令

    将数据从内存中读出来,存到寄存器中

    此ldr 和 str 的变种ldp 和 stp 还可以操作2个寄存器.

    堆栈操作练习

    使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.

    sub    sp, sp, #0x20    ;拉伸栈空间32个字节
    stp    x0, x1, [sp, #0x10] ;sp往上加16个字节,存放x0 和 x1
    ldp    x1, x0, [sp, #0x10] ;将sp偏移16个字节的值取出来,放入x1 和 x0
    

    bl和ret指令

    bl标号

    • 将下一条指令的地址放入lr(x30)寄存器
    • 转到标号处执行指令


      image.png

    ret

    • 默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下条指令地址!

    ARM64平台的特色指令,它面向硬件做了优化处理的

    x30寄存器

    x30寄存器存放的是函数的返回地址.当ret指令执行时刻,会寻找x30寄存器保存的地址值!

    注意:在函数嵌套调用的时候.需要讲x30入栈!

    adrp

    是计算指定的数据地址到当前PC值的相对偏移。

     /*1.先将1的值左移12位二进制位则为 1 0000 0000 0000 ==> 0x1000
      *2.将 PC 寄存器的低12位清零,也就是0x100c1e6c4 ==> 0x100c1f000
      */
     0x100c1e6c4 <+36>: adrp   x0, 1
    
    //0x100c1f000 + 0x65c ==> 0x100c1f65c也就是说这个常量所对应的值得地址是0x100c1f65c
     0x100c1e6c8 <+40>: add    x0, x0, #0x65c            ; =0x65c 
     
      memory read X  //简写memory read 简写x
      0x100400e48: d9 55 2b a5 01 00 00 00 c1 eb 3f 00 01 00 00 00  
      0x100400e58: ac c7 a0 8c 01 00 00 00 f8 0e 40 00 01 00 00 00  
     //iOS是从右边向左读10位 0x 01 a5 2b 55 d9
      p (char *)0x01a52b55d9 //实际是什么类型,就强转成什么类型
    

    bl指令

    • CPU从何处执行指令是由pc中的内容决定的,我们可以通过改变pc的内容来控制CPU执行目标指令

    • ARM64提供了一个mov指令(传送指令),可以用来修改大部分寄存器的值,比如

      • mov x0,#10、mov x1,#20
    • 但是,mov指令不能用于设置pc的值,ARM64没有提供这样的功能

    • ARM64提供了另外的指令来修改PC的值,这些指令统称为转移指令,最简单的是bl指令

    bl指令 -- 练习

    现在有两段代码!假设程序先执行A,请写出指令执行顺序.最终寄存器x0的值是多少?

    _A:
        mov x0,#0xa0
        mov x1,#0x00
        add x1, x0, #0x14
        mov x0,x1
        bl _B
        mov x0,#0x0
        ret
    
    _B:
        add x0, x0, #0x10
        ret
    

    相关文章

      网友评论

        本文标题:逆向学习笔记3——寄存器与汇编指令

        本文链接:https://www.haomeiwen.com/subject/hbgblftx.html