概述
一个APP安装在手机上面的可执行文件本质上是二进制文件.因为iPhone手机本质上执行的指令是二进制.是由手机上的CPU执行的.所以静态分析是建立在分析二进制上面。
汇编语言的发展
机器语言
由0和1组成的机器指令:
· 加:0100 0000
· 减:0100 1000
· 乘:1111 0111 1110 0000
· 除:1111 0111 1111 0000
汇编语言
使用助记符代替机器语言:
· 加:INC EAX 通过编译器 0100 0000
· 减:DEC EAX 通过编译器 0100 1000
· 乘:MUL EAX 通过编译器 1111 0111 1110 0000
· 除:DIV EAX 通过编译器 1111 0111 1111 0000
高级语言
C\C++\Java\OC\Swift,更加接近人类的自然语言比如C语言:
· 加:A+B 通过编译器 0100 0000
· 减:A-B 通过编译器 0100 1000
· 乘:A*B 通过编译器 1111 0111 1110 0000
· 除:A/B 通过编译器 1111 0111 1111 0000
代码在终端转换的过程如下图所示:
![](https://img.haomeiwen.com/i25800336/9c5ab661355e1b29.png)
· 汇编语言与机器语言一一对应,每一条机器指令都有与之对应的汇编指令
· 汇编语言可以通过编译得到机器语言,机器语言可以通过反汇编得到汇编语言
· 高级语言可以通过编译得到汇编语言 \ 机器语言,但汇编语言\机器语言几乎不可能还原成高级语言
汇编语言的特点
· 可以直接访问、控制各种硬件设备,比如存储器、CPU等,能最大限度地发挥硬件的功能
· 能够不受编译器的限制,对生成的二进制代码进行完全的控制
· 目标代码简短,占用内存少,执行速度快
· 汇编指令是机器指令的助记符,同机器指令一一对应。每一种CPU都有自己的机器指令集\汇编指令集,所 以汇编语言不具备可移植性
· 知识点过多,开发者需要对CPU等硬件结构有所了解,不易于编写、调试、维护
· 不区分大小写,比如mov和MOV是一样的
汇编在iOS开发中的用途
· 编写驱动程序、操作系统(比如Linux内核的某些关键部分)
· 对性能要求极高的程序或者代码片段,可与高级语言混合使用(内联汇编)
· 软件安全
· 病毒分析与防治
· 逆向\加壳\脱壳\破解\外挂\免杀\加密解密\漏洞\黑客
· 理解整个计算机系统的最佳起点和最有效途径
· 为编写高效代码打下基础
· 弄清代码的本质
汇编语言的种类(常见)
· 8086汇编(8086处理器是16bit的CPU)
· Win32汇编
· Win64汇编
· ARM汇编(嵌入式、Mac、iOS)
注意:iOS开发主要用ARM汇编,iphone5s以后设备主要用arm64汇编。
APP/程序的执行过程
![](https://img.haomeiwen.com/i25800336/22d7737181f1d6cb.png)
汇编中,大部分的指令都是与cpu跟内存相关的,所以我们一下要对cpu进行一系列的了解。
CPU总线
每一个CPU芯片都有许多管脚,这些管脚和总线相连,CPU通过总线跟外部器件进行交互
总线:一根根导线的集合
总线的分类:
· 地址总线
· 数据总线
· 控制总线
![](https://img.haomeiwen.com/i25800336/7622ba00d25a688a.png)
![](https://img.haomeiwen.com/i25800336/e11085552c9a4759.png)
地址总线
· 它的宽度决定了CPU的寻址能力
· 8086的地址总线宽度是20,所以寻址能力是1M( 220 )
数据总线
· 它的宽度决定了CPU的单次数据传送量,也就是数据传送速度
· 8086的数据总线宽度是16,所以单次最大传递2个字节的数据
控制总线
· 它的宽度决定了CPU对其他器件的控制能力、能有多少种控制
![](https://img.haomeiwen.com/i25800336/f0e5d9c5d554a371.png)
CPU&寄存器
内部部件之间由总线连接
![](https://img.haomeiwen.com/i25800336/8603012bf6d4f016.png)
CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。
CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。
对于arm64系的CPU来说, 如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。
· 对程序员来说,CPU中最主要部件是寄存器,可以通过改变寄存器的内容来实现对CPU的控制
· 不同的CPU,寄存器的个数、结构是不相同的
通用寄存器
通用寄存器也称数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。
ARM64拥有有32个64位的通用寄存器 x0 到 x30,以及XZR(零寄存器),这些通用寄存器有时也有特定用途。
· 那么w0 到 w28 这些是32位的. 因为64位CPU可以兼容32位.所以可以只使用64位寄存器的低32位.
· 比如 w0 就是 x0的低32位!
![](https://img.haomeiwen.com/i25800336/9fe5387dedb7a4bf.png)
寄存器还有浮点寄存器和向量寄存器,需要了解的话可以查看相关文档。
通常,CPU会先将内存中的数据存储到通用寄存器中,然后再对通用寄存器中的数据进行运算,假设内存中有块红色内存空间的值是3,现在想把它的值加1,并将结果存储到蓝色内存空间。
![](https://img.haomeiwen.com/i25800336/953d386a36bbebe3.png)
分析:
1.CPU首先会将红色内存空间的值放到X0寄存器中:mov X0,红色内存空间
2.然后让X0寄存器与1相加:add X0,1
3.最后将值赋值给内存空间:mov 蓝色内存空间,X0
pc寄存器(program counter)
为指令指针寄存器,它指示了CPU当前要读取指令的地址
在内存或者磁盘上,指令和数据没有任何区别,都是二进制信息
CPU在工作的时候把有的信息看做指令,有的信息看做数据,为同样的信息赋予了不同的意义
比如 1110 0000 0000 0011 0000 1000 1010 1010
可以当做数据 0xE003008AA
也可以当做指令 mov x0, x8
CPU根据什么将内存中的信息看做指令?
CPU将pc指向的内存单元的内容看做指令
如果内存中的某段内容曾被CPU执行过,那么它所在的内存单元必然被pc指向过
高速缓存
iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB,2级缓存的容量8M.
CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成).CPU直接从高速缓存依次读取指令来执行.
网友评论