iOS逆向之初识别汇编

作者: 聚朋友iOS | 来源:发表于2021-03-30 10:26 被阅读0次

汇编语言是使用助记符代替机器语言。

汇编语言的种类，目前讨论比较多的汇编语言有

• 8086汇编（8086处理器是16bit的CPU）

• Win32汇编

• Win64汇编

• ARM汇编（嵌入式、Mac、iOS）

......

iPhone里面用到的是ARM汇编，但是不同的设备也有差异，因CPU的架构不同

我们的代码在终端设备上是这样的过程

1.汇编语言与机器语言一一对应，每一条机器指令都有与之对应的汇编指令

2.汇编语言可以通过编译得到机器语言，机器语言可以通过反汇编得到汇编语言

3.高级语言可以通过编译得到汇编语言\机器语言，但汇编语言\机器语言几乎不可能还原成高级语言

几个必要的常识

• 要想学好汇编,首先需要了解CPU等硬件结构

• APP/程序的执行过程

• 硬件相关最为重要是CPU/内存

• 在汇编中,大部分指令都是和CPU与内存相关的

总线

每一个CPU芯片都有许多管脚，这些管教和总线相连，CPU通过总线跟外部器件进行交互

总线：一根根导线的集合

总线的分类

地址总线、数据总线、控制总线

地址总线

• 它的宽度决定了CPU的寻址能力

• 8086的地址总线宽度是20，所以寻址能力是1M（）

数据总线

• 它的宽度决定了CPU的单次数据传递量，也就是数据传送速度

• 8086的数据总线宽度是16，所以单次最大传递2个字节的数据

控制总线

• 它的宽度决定了CPU对其他器件的控制能力、能有多少种控制

内存

• 内存地址空间的大小受CPU地址总线宽度的限制。8086的地址总线宽度为20，可以定位2的20次方个不同的内存单位（内存地址范围0x0000~0xFFFFF），所以8086的内存空间大小为1M

• 0x00000~0x9FFFF:主存储器，可读可写

• 0xA0000~0xBFFFF:向显存中写入数据，这些数据会被显卡输出到显示器。可读可写

• 0xC0000~0xFFFFF:存储各种硬件\系统消息，只读

CPU&寄存器

内部部件之间由总线连接

CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。

CPU的运算速度是非常快的，为了性能CPU在内部开辟一小块临时存储区域，并在进行运算时先将数据从内存复制到这一小块临时存储区域中，运算时就在这一小块临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

对于arm64系的CPU来说，如果寄存器以x开头则表明的是一个64位的寄存器，如果以w开头则表明是一个32位的寄存器，在系统中没有提供16位和8位的寄存器访问和使用。其中32位的寄存器是64位寄存器的低332位部分并不是独立存在的。

对程序员来说，CPU中最主要部件是寄存器，可以通过改变寄存器的内容来实现对CPU的控制

不同的CPU，寄存器的个数，结构是不相同的

浮点和向量寄存器

因为浮点数的存储以及其运算的特殊性，CPU中专门提供浮点数寄存器来处理浮点数

浮点寄存器64位：D0-D31 32位：S0 - S31

现在的CPU支持向量运算。（向量运算在图形处理相关的领域用得非常多）为了支持向量计算系统也提供了众多的向量寄存器。向量寄存器128位：V0- V31

通用寄存器

通用寄存器也称数据地址寄存器，通常用来做数据计算的临时存储、做累加、计计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数，在CPU中当做一些常规变量来使用。

ARM64拥有32个64位的寄存器X0-X30,以及XZR(零寄存器)，这些通用寄存器有时也有特定用途。

• 64位: X0-X30, XZR(零寄存器)

• 32位: W0-W30, WZR(零寄存器)

那么w0到w28这些是32位的。因为64位CPU可以兼容32位，所以可以只使用64位寄存器的低32位。

比如w0就是x0的低32位。

* 通常，CPU会先将内存中的数据存储到通用寄存器中，然后再对通用寄存器中的数据进行运算

* 假设内存中有块红色内存空间的值是3，现在想把它的值加1，并将结果存储到蓝色内存空间

CPU首先会将红色内存空间的值放到X0寄存器中：mov X0,红色内存空间

然后让X0寄存器与1相加：add X0,1

最后将值赋值给内存空间：mov 蓝色内存空间,X0

pc寄存器（program counter）

为指令指针寄存器，它指示了CPU当前要读取指令的地址

在内存或者磁盘上，指令和数据没有任何区别，都是二进制信息

CPU在工作的时候把有的信息看做指令，有的信息看做数据，为同样的信息赋予了不用的意义

比如 1110 0000 0000 0011 0000 1000 1010 1010

可以当做数据 0xE003008AA

也可以当做指令 mov x0, x8

CPU根据什么将内存中的信息看做指令？

CPU将pc指向的内存单元的内容看做指令

如果内存中的某段内容曾被CPU执行过，那么它所在的内存单元必然被pc指向过

高速缓存

iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB，2级缓存的容量8M

CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多，为了性能，CPU还集成了一个高速缓存存储区域，当程序在运行时，先将要执行的指令代码以及数据复制到高速缓存中区（有操作系统完成），CPU直接从高速缓存依次读取指令来执行

bl指令

CPU从何处执行指令是由pc中的内容决定的，我们可以通过改变pc的内容来控制CPU执行目标指令

ARM64提供了一个mov指令（传送指令），可以用来修改大部分寄存器的值，比如 mov x0,#10

但是，mov指令不能用于设置pc的值，ARM64没有提供这样的功能

ARM64提供了另外的指令来修改PC的值，这些指令统称为转移指令，最简单的是bl指令

bl指令 -- 练习

现在有两段代码!假设程序先执行A,请写出指令执行顺序.最终寄存器x0的值是多少?

_A:

mov x0,#0xa0

mov x1,#0x00

add x1, x0, #0x14

mov x0,x1

bl _B

mov x0,#0x0

ret

_B:

add x0, x0, #0x10

ret

网友评论

本文标题：iOS逆向之初识别汇编

本文链接：https://www.haomeiwen.com/subject/gaphdttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！