美文网首页
iOS逆向之初识别汇编

iOS逆向之初识别汇编

作者: 聚朋友iOS | 来源:发表于2021-03-30 10:26 被阅读0次

    汇编语言是使用助记符代替机器语言。

    汇编语言的种类,目前讨论比较多的汇编语言有

        •  8086汇编(8086处理器是16bit的CPU)

        •  Win32汇编

        •  Win64汇编

        •  ARM汇编(嵌入式、Mac、iOS)

        ......

    iPhone里面用到的是ARM汇编,但是不同的设备也有差异,因CPU的架构不同

    我们的代码在终端设备上是这样的过程

    1.汇编语言与机器语言一一对应,每一条机器指令都有与之对应的汇编指令

    2.汇编语言可以通过编译得到机器语言,机器语言可以通过反汇编得到汇编语言

    3.高级语言可以通过编译得到汇编语言\机器语言,但汇编语言\机器语言几乎不可能还原成高级语言

    几个必要的常识

    •  要想学好汇编,首先需要了解CPU等硬件结构

    •  APP/程序的执行过程

    •  硬件相关最为重要是CPU/内存

    •  在汇编中,大部分指令都是和CPU与内存相关的

    总线

        每一个CPU芯片都有许多管脚,这些管教和总线相连,CPU通过总线跟外部器件进行交互

        总线:一根根导线的集合

    总线的分类 

        地址总线、数据总线、控制总线

    地址总线

        •  它的宽度决定了CPU的寻址能力

        •  8086的地址总线宽度是20,所以寻址能力是1M()

    数据总线

        •  它的宽度决定了CPU的单次数据传递量,也就是数据传送速度

        •  8086的数据总线宽度是16,所以单次最大传递2个字节的数据

    控制总线

        •  它的宽度决定了CPU对其他器件的控制能力、能有多少种控制

    内存

        •  内存地址空间的大小受CPU地址总线宽度的限制。8086的地址总线宽度为20,可以定位2的20次方个不同的内存单位(内存地址范围0x0000~0xFFFFF),所以8086的内存空间大小为1M

        •  0x00000~0x9FFFF:主存储器,可读可写

        •  0xA0000~0xBFFFF:向显存中写入数据,这些数据会被显卡输出到显示器。可读可写

        •  0xC0000~0xFFFFF:存储各种硬件\系统消息,只读

    CPU&寄存器

        内部部件之间由总线连接

    CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。

    CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小块临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

    对于arm64系的CPU来说,如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器访问和使用。其中32位的寄存器是64位寄存器的低332位部分并不是独立存在的。

    对程序员来说,CPU中最主要部件是寄存器,可以通过改变寄存器的内容来实现对CPU的控制

    不同的CPU,寄存器的个数,结构是不相同的

    浮点和向量寄存器

        因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数

        浮点寄存器64位:D0-D31  32位:S0 - S31

        现在的CPU支持向量运算。(向量运算在图形处理相关的领域用得非常多)为了支持向量计算 系统也提供了众多的向量寄存器。向量寄存器128位:V0- V31

    通用寄存器

    通用寄存器也称数据地址寄存器,通常用来做数据计算的临时存储、做累加、计计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。

    ARM64拥有32个64位的寄存器X0-X30,以及XZR(零寄存器),这些通用寄存器有时也有特定用途。

            • 64位: X0-X30, XZR(零寄存器)

            • 32位: W0-W30, WZR(零寄存器)

    那么w0到w28这些是32位的。因为64位CPU可以兼容32位,所以可以只使用64位寄存器的低32位。

    比如w0就是x0的低32位。

    * 通常,CPU会先将内存中的数据存储到通用寄存器中,然后再对通用寄存器中的数据进行运算

    * 假设内存中有块红色内存空间的值是3,现在想把它的值加1,并将结果存储到蓝色内存空间

    CPU首先会将红色内存空间的值放到X0寄存器中:mov X0,红色内存空间

    然后让X0寄存器与1相加:add X0,1

    最后将值赋值给内存空间:mov 蓝色内存空间,X0

    pc寄存器(program counter)

    为指令指针寄存器,它指示了CPU当前要读取指令的地址

    在内存或者磁盘上,指令和数据没有任何区别,都是二进制信息

    CPU在工作的时候把有的信息看做指令,有的信息看做数据,为同样的信息赋予了不用的意义

    比如 1110 0000 0000 0011 0000 1000 1010 1010

    可以当做数据 0xE003008AA

    也可以当做指令 mov x0, x8

    CPU根据什么将内存中的信息看做指令?

    CPU将pc指向的内存单元的内容看做指令

    如果内存中的某段内容曾被CPU执行过,那么它所在的内存单元必然被pc指向过

    高速缓存

    iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB,2级缓存的容量8M

    CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域,当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中区(有操作系统完成),CPU直接从高速缓存依次读取指令来执行

    bl指令

    CPU从何处执行指令是由pc中的内容决定的,我们可以通过改变pc的内容来控制CPU执行目标指令

    ARM64提供了一个mov指令(传送指令),可以用来修改大部分寄存器的值,比如 mov x0,#10

    但是,mov指令不能用于设置pc的值,ARM64没有提供这样的功能

    ARM64提供了另外的指令来修改PC的值,这些指令统称为转移指令,最简单的是bl指令

    bl指令 -- 练习

    现在有两段代码!假设程序先执行A,请写出指令执行顺序.最终寄存器x0的值是多少?

    _A:

        mov x0,#0xa0

        mov x1,#0x00

        add x1, x0, #0x14

        mov x0,x1

        bl _B

        mov x0,#0x0

        ret

    _B:

        add x0, x0, #0x10

        ret

    相关文章

      网友评论

          本文标题:iOS逆向之初识别汇编

          本文链接:https://www.haomeiwen.com/subject/gaphdttx.html