Qinz
创建一个对象是我们再熟悉不过的了,那么它转换为汇编代码又是怎么执行的呢?接下来我们就通过最常见的创建对象入手,详细分析对象创建和销毁的汇编,从汇编中还原函数调用逻辑。
1. 首先我们来看下面一行代码,这里就只是创建一个P对象:
- (void)viewDidLoad {
[super viewDidLoad];
Person* p = [[Person alloc]init];
}
- 1.1 上面是我们最熟悉的对象创建,我们知道,alloc和init都是发送消息,接下来我们断点程序,查看到汇编代码如下:
CS`-[ViewController viewDidLoad]:
0x10064a764 <+0>: sub sp, sp, #0x40 ; =0x40
0x10064a768 <+4>: stp x29, x30, [sp, #0x30]
0x10064a76c <+8>: add x29, sp, #0x30 ; =0x30
0x10064a770 <+12>: add x8, sp, #0x10 ; =0x10
0x10064a774 <+16>: adrp x9, 2
0x10064a778 <+20>: add x9, x9, #0xd00 ; =0xd00
0x10064a77c <+24>: adrp x10, 2
0x10064a780 <+28>: add x10, x10, #0xd30 ; =0xd30
0x10064a784 <+32>: stur x0, [x29, #-0x8]
0x10064a788 <+36>: stur x1, [x29, #-0x10]
-> 0x10064a78c <+40>: ldur x0, [x29, #-0x8]
0x10064a790 <+44>: str x0, [sp, #0x10]
0x10064a794 <+48>: ldr x10, [x10]
0x10064a798 <+52>: str x10, [sp, #0x18]
0x10064a79c <+56>: ldr x1, [x9]
0x10064a7a0 <+60>: mov x0, x8
0x10064a7a4 <+64>: bl 0x10064ab9c ; symbol stub for: objc_msgSendSuper2
0x10064a7a8 <+68>: adrp x8, 2
0x10064a7ac <+72>: add x8, x8, #0xd08 ; =0xd08
0x10064a7b0 <+76>: adrp x9, 2
0x10064a7b4 <+80>: add x9, x9, #0xd20 ; =0xd20
0x10064a7b8 <+84>: ldr x9, [x9]
0x10064a7bc <+88>: ldr x1, [x8]
0x10064a7c0 <+92>: mov x0, x9
0x10064a7c4 <+96>: bl 0x10064ab90 ; symbol stub for: objc_msgSend
0x10064a7c8 <+100>: adrp x8, 2
0x10064a7cc <+104>: add x8, x8, #0xd10 ; =0xd10
0x10064a7d0 <+108>: ldr x1, [x8]
0x10064a7d4 <+112>: bl 0x10064ab90 ; symbol stub for: objc_msgSend
0x10064a7d8 <+116>: mov x8, #0x0
0x10064a7dc <+120>: add x9, sp, #0x8 ; =0x8
0x10064a7e0 <+124>: str x0, [sp, #0x8]
0x10064a7e4 <+128>: mov x0, x9
0x10064a7e8 <+132>: mov x1, x8
0x10064a7ec <+136>: bl 0x10064abc0 ; symbol stub for: objc_storeStrong
0x10064a7f0 <+140>: ldp x29, x30, [sp, #0x30]
0x10064a7f4 <+144>: add sp, sp, #0x40 ; =0x40
0x10064a7f8 <+148>: ret
- 1.2 可以看到上面简单的一句代码转换为了很多条汇编指令,汇编指令是与机器码一一对应的,每执行一条汇编指令就是一个通电放电的过程,所以每条汇编执行执行的时间几乎相等。上面是在arm64架构下的汇编代码,不同的指令集对应的汇编代码会有所不同。接下来会分段剖析该汇编指令。
2. 首先分析前4条指令
//拉伸64字节栈控件,sp为指向栈底的寄存器
0x104802764 <+0>: sub sp, sp, #0x40 ; =0x40
// x29和x30寄存器入栈
0x104802768 <+4>: stp x29, x30, [sp, #0x30]
//sp指向48字节处位置,存入x29寄存器
0x10480276c <+8>: add x29, sp, #0x30 ; =0x30
//sp从#0x30处偏移#0x10,即指向16直接处
0x104802770 <+12>: add x8, sp, #0x10 ; =0x10
-
2.1 关于寄存器,这里简单说下,如下图:
寄存器
-
2.2 如上图,iOS中主要有异常处理寄存器、浮点寄存器以及通用寄存器。通用寄存器也称数据地址寄存器,通常用来做数据计算的临时存储、累加、计数、地址保存等功能,定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。ARM64拥有有32个64位的通用寄存器 x0 到 x30,以及XZR(零寄存器),这些通用寄存器有时也有特定用途,w0 到 w28 这些是32位的. 因为64位CPU可以兼容32位.所以可以只使用64位寄存器的低32位。而在XCode中并没有看到X29和X30寄存器,如下图:
通用寄存器
-
2.3 其实这里的fp就是x29,lr就是x30寄存器,只不过被苹果重新进行了命名。x29在某些时刻会保存栈顶的地址,sp会一直保存栈底的地址,lr(x30)保存下一条指令执行的地址,pc指向当前指令的地址,cpsr为状态寄存器。如下图:
寄存器
-
2.4 为了更形象理解上面4条指令,绘制栈空间分配图如下:
拉伸栈空间
3. 接下来继续往下看,x9寄存器放置ViewDidLoad方法的地址
//将地址 0x104802774 左移三位 即 0x104802000 ,让后加2,即0x104804000
0x104802774 <+16>: adrp x9, 2
//将后三位偏移加上0xd00 ,得到地址0x104804d00
0x104802778 <+20>: add x9, x9, #0xd00 ; =0xd00
-
3.1 通过算出该地址,我们即可以得到该方法名,如下图:
x9寄存器
-
3.2 当然这里读取x1的值也是该方法,因为最后x9会被读到x1中。默认函数的调用者被放在x0寄存器,方法地址被放在x1寄存器。
x1寄存器
- 3.3 通过相同的方法,我们分析接下来的两句指令:
0x10064a77c <+24>: adrp x10, 2
0x10064a780 <+28>: add x10, x10, #0xd30 ; =0xd30
-
3.3 寄存器 x10放置self对象的地址:
x10寄存器
4. 将x0和x1寄存器入栈:
0x10064a784 <+32>: stur x0, [x29, #-0x8]
0x10064a788 <+36>: stur x1, [x29, #-0x10]
-
4.1 x0和x1入栈图:
x0和x1入栈
5. 将x29的值读到x0中,x0入栈:
-> 0x10064a78c <+40>: ldur x0, [x29, #-0x8]
0x10064a790 <+44>: str x0, [sp, #0x10]
6. 从栈区取出X10,也就是上面的self,然后再将x10拉伸24字节,我们可以看到,后面没有对X10这个寄存器的操作呢,说明对x10进行入栈保护,即当前控制器的地址在页面没销毁的情况下是一直强持有的。
0x10064a794 <+48>: ldr x10, [x10]
0x10064a798 <+52>: str x10, [sp, #0x18]
7. 将X9读到x1寄存器中,也就是上面的ViewDidLoad。然后将X8移动到X0寄存器,这样就将X8和X9两个寄存器给空出来,后面的函数进来就可以利用这一块空间了。
0x10064a79c <+56>: ldr x1, [x9]
0x10064a7a0 <+60>: mov x0, x8
8. 接下来可以看到objc_msgSendSuper2,就是调用 [super viewDidLoad]这个方法了,bl指令会调到方法内部,并且该命令会保存上一条指令。
0x10064a7a4 <+64>: bl 0x10064ab9c ; symbol stub for: objc_msgSendSuper2
9. 接着x8寄存器就存储alloc方法的地址了,如下图:
x8被再次利用
10. 然后x9就用来存储对象的地址了,如下图:
x9被再次利用
11. 接着调用objc_msgSend发送alloc消息:
12. 当alloc调用完毕后,x8寄存器又被重复利用到存储init方法的地址:
x8再次被利用
13. 以上重点分析的是通过汇编看函数调用,接下来下面这6句汇编指令,就是和内存管理相关的:
//将x8赋值为0,即x8 = nil
0x10064a7d8 <+116>: mov x8, #0x0
//x9 = x9 + sp(#0x8)
0x10064a7dc <+120>: add x9, sp, #0x8 ; =0x8
//x0入栈
0x10064a7e0 <+124>: str x0, [sp, #0x8]
//x0 = x9,x1 = x8作为参数传入objc_storeStrong函数
-> 0x10064a7e4 <+128>: mov x0, x9
0x10064a7e8 <+132>: mov x1, x8
0x10064a7ec <+136>: bl 0x10064abc0 ; symbol stub for: objc_storeStrong
14. 通过查看x9寄存器的地址,可以得出x9寄存器保存的是person对象的指针:
保存指针的地址
15. 所以这里的两个参数x0和x1分别为&p和nil,伪代码如下:
func(&p,nil);
16. 为了了解这个objc_storeStrong函数在做什么,我们就要去objc源码去查看,该函数的源码如下:
void
objc_storeStrong(id *location, id obj)
{
id prev = *location;
if (obj == prev) {
return;
}
objc_retain(obj);
*location = obj;
objc_release(prev);
}
17. 所以将p对象传入方法后就等价于下面的代码了:
void
objc_storeStrong(&p, nil)
{
id p = *&p;
if (obj == nil) {
return;
}
objc_retain(nil);
&p = nil;
objc_release(p);
}
@end
-
17.1 内存管理如下图:
内存管理
18. 最后三句汇编指令代表该函数的结束,即平衡栈空间:
0x10064a7f0 <+140>: ldp x29, x30, [sp, #0x30]
0x10064a7f4 <+144>: add sp, sp, #0x40 ; =0x40
0x10064a7f8 <+148>: ret
-
18.1 函数调用的栈空间变化图:
栈空间变化
网友评论