关于CPU的补充
寄存器
CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。
CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。
对于arm64系的CPU来说, 如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。
高速缓存
iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB,2级缓存的容量8M.
CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成).CPU直接从高速缓存依次读取指令来执行.
寄存器的补充
数据地址寄存器
数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。
ARM64中
- 64位: X0-X30, XZR(零寄存器)
- 32位: W0-W30, WZR(零寄存器)
注意:
之前讲解8086汇编中有一种特殊的寄存器段寄存器:CS,DS,SS,ES四个寄存器来保存这些段的基地址,这个属于Intel架构CPU中.在ARM中并没有
浮点和向量寄存器
因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数
- 浮点寄存器 64位: D0 - D31 32位: S0 - S31
现在的CPU支持向量运算.(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器.
- 向量寄存器 128位:V0-V31
栈
-
栈:是一种具有特殊的访问方式的存储空间(后进先出, Last In Out First,LIFO)
15193998892055
SP和FP寄存器
- sp寄存器在任意时刻会保存我们栈顶的地址.
- fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!
注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
ARM64里面 对栈的操作是16字节对齐的!!
函数调用栈
常见的函数调用开辟和恢复的栈空间
sub sp, sp, #0x40 ; 拉伸0x40(64字节)空间
stp x29, x30, [sp, #0x30] ;x29\x30 寄存器入栈保护
add x29, sp, #0x30 ; x29指向栈帧的底部
...
ldp x29, x30, [sp, #0x30] ;恢复x29/x30 寄存器的值
add sp, sp, #0x40 ; 栈平衡
ret
![](https://img.haomeiwen.com/i4193251/3098ec20bc3e4c52.jpg)
关于内存读写指令
注意:读/写 数据是都是往高地址读/写
str(store register)指令
将数据从寄存器中读出来,存到内存中.
ldr(load register)指令
将数据从内存中读出来,存到寄存器中
此ldr 和 str 的变种ldp 和 stp 还可以操作2个寄存器.
[]中括号中的内容代表寻址
![](https://img.haomeiwen.com/i4193251/1c4378c2dc174c23.jpg)
1.开辟32字节内存空间
2.从寄存器中读取x0和x1的值存放到sp+0x10的栈地址空间中,两个8字节正好是16字节
3.从sp+0x10的栈地址内存中读取值存放到x1和x0中,正好进行了x0和x1的值的交换
4.返回ViewDidLoad函数中
变化的是寄存器x0和x1里面的内容,没有变化的是sp寄存器里面的内容,和内存中的内容,sp相当于一个标记指针
此时此刻栈空间并没有平衡,有32个字节没有回收,你的世界少了32个字节
![](https://img.haomeiwen.com/i4193251/9a05cde910a9ded4.jpg)
sp往上平移32个字节,释放申请的32个字节的内存空间,保持栈平衡
![](https://img.haomeiwen.com/i4193251/3d65b39d7e492ddf.jpg)
![](https://img.haomeiwen.com/i4193251/ad58461057ecc350.jpg)
关于虚拟内存的一张图
栈(stack),堆区(head),全局区/静态区(未初始化),全局区/静态区(已经初始化过的),常量,代码区
![](https://img.haomeiwen.com/i4193251/8b73074a771294f2.jpg)
Mach-O文件:全局区/静态区(未初始化),全局区/静态区(已经初始化过的),常量,代码区
栈区和堆区是在代码不断执行过程中去开辟的,栈是从高地址往低地址减,栈顶有专门的sp去记录,堆是低地址往高地址加
死循环会不会崩溃:
1.没有开辟内存空间,一直执行,程序不会崩溃
![](https://img.haomeiwen.com/i4193251/77a502178b4c07b7.jpg)
2.有开辟内存空间,会一直申请开辟内存空间,sp一直减,此时程序会堆栈溢出stack overflow,即堆和栈碰头了,地址空间用完了
![](https://img.haomeiwen.com/i4193251/0fea7cf8912d1c56.jpg)
堆栈操作练习
使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.
sub sp, sp, #0x20 ;拉伸栈空间32个字节
stp x0, x1, [sp, #0x10] ;sp往上加16个字节,存放x0 和 x1
ldp x1, x0, [sp, #0x10] ;将sp偏移16个字节的值取出来,放入x1 和 x0
bl和ret指令
bl标号
- 将下一条指令的地址放入lr(x30)寄存器
- 转到标号处执行指令
ret
- 默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下条指令地址!
ARM64平台的特色指令,它面向硬件做了优化处理的
x30寄存器
x30寄存器存放的是函数的返回地址.当ret指令执行时刻,会寻找x30寄存器保存的地址值!
注意:在函数嵌套调用的时候.需要将x30入栈!
![](https://img.haomeiwen.com/i4193251/46a082b06bb0192a.png)
调试汇编代码:从ViewDidLoad方法中跳入B之后,lr寄存器中存放回到ViewDidLoad方法的吓一跳指令的值
![](https://img.haomeiwen.com/i4193251/f734241ab14a0bbc.jpg)
从方法A跳入B,lr的值发生改变,lr存放A中bl跳转前的吓一跳指令的地址,便于B中ret后能回到A中,ret只会看lr
![](https://img.haomeiwen.com/i4193251/5789e78df4650e04.jpg)
PC寄存器:是指接下来要执行的内存地址
ret:让CPU将lr作为接下来要执行的内存地址,会把lr里面的值赋值给pc,ret改变pc,bl改变pc和lr
从A中跳转到B中后,ret让CPU从B中回到A中的mov x0,#0xaaaa指令
![](https://img.haomeiwen.com/i4193251/112a6fc44fa2ec8e.jpg)
回到A中后,lr的值仍旧为A中跳入B中之前的指令mov x0,#xaaaa的内存地址,此时执行ret时会进入循环进入mov x0,#0xaaaa,此时死循环了,
![](https://img.haomeiwen.com/i4193251/abbda02d8fa838fd.jpg)
此时要想回到ViewDidLoad方法呢?该如何操作
保护lr寄存器回家的路:保存lr的值到其他的寄存器中不安全,因为其他的寄存器在接下来函数的调用中有可能被占用导致修改
通过bt可以发现,堆栈中存在很多函数嵌套调用,若用寄存器存lr的值,极有可能被覆盖,此时我们想到用自己的栈来保存lr的值
![](https://img.haomeiwen.com/i4193251/6af52ebd25595fed.jpg)
首先查看系统在处理嵌套调用时,是怎么保存回家的路lr的值的
![](https://img.haomeiwen.com/i4193251/7f2326da358f4f09.jpg)
1.stp x29, x30, [sp, #-0x10]!:将x29(fp),x30(lr)两个寄存器的值读取出来存到新开辟的16字节内存空间sp-0x10中,寄存器是64位8字节,正好两个寄存器保存的内存地址内容大小为8字节,!表示将[sp,#-0x10]算出来的值赋值给sp
2.ldp x29, x30, [sp], #0x10:从sp寄存器开始的位置读取两个8字节的内容分别赋值给x29和x30寄存器,并将sp寄存器的地址指向sp+#0x16,即回收地址,保持栈平衡
3.mov x29, sp:x29保存sp的值,x29和sp指向栈顶,也是栈底,即栈顶和栈底是同一片区域
![](https://img.haomeiwen.com/i4193251/3b132bd32ce5760c.jpg)
进入d函数之前lr的值为回到c函数的bl指令的下一条指令的地址
![](https://img.haomeiwen.com/i4193251/5c18ec789a1ea9fc.jpg)
回到c函数之后执行ldp x29, x30, [sp], #0x10,则lr的地址为从ViewDidLoad中进入c函数之前保存的lr的值,回到ViewDidLoad中方法的回家的路,进入c函数之后ret之后的下一条指令的地址
![](https://img.haomeiwen.com/i4193251/2f2a0b206206ea10.jpg)
ret之后回到ViewDidLoad中
![](https://img.haomeiwen.com/i4193251/b7165c434678c9d2.jpg)
![](https://img.haomeiwen.com/i4193251/a349b94277b9fb07.jpg)
因此我们可以改写汇编代码保存x30的值
![](https://img.haomeiwen.com/i4193251/db6e65042a4a6375.jpg)
从B函数返回后,x0的值变化为0xbbbb,从栈内存中取进入A函数之开始位置时保存的lr的值
![](https://img.haomeiwen.com/i4193251/5c0a6f1dae1e7993.png)
![](https://img.haomeiwen.com/i4193251/8c072933359acd21.jpg)
此时从A函数中执行ret执行,CPU能找到回家的路,回到ViewDidLoad方法中进入A函数之后的下一条指令
![](https://img.haomeiwen.com/i4193251/33e1ecb4d6fefc5e.png)
回到ViedDidLoad中的进入A之后的下一条指令ldp x29, x30, [sp, #0x20]
![](https://img.haomeiwen.com/i4193251/ffa2f4c7b39fff10.jpg)
可以有另外一种简写形式,中括号中的内容代表从这儿开始寻址
str x30,[sp,#-0x8]!最后面的!不能丢
![](https://img.haomeiwen.com/i4193251/7bd85ca293d074ec.jpg)
lr(x30)寄存器是64位8字节,若存储x30时,在栈内存中开辟8字节内存,是否可行呢?
![](https://img.haomeiwen.com/i4193251/7405c7c705d374b9.jpg)
sp栈里面的操作必须是16字节对齐,否则会导致崩溃
![](https://img.haomeiwen.com/i4193251/9f7f6e22ffd1e8c0.jpg)
函数的参数和返回值
ARM64下,函数的参数是存放在X0到X7(W0到W7)这8个寄存器里面的.如果超过8个参数,就会入栈.
函数的返回值是放在X0 寄存器里面的.
1.查看系统怎么处理参数和返回值
![](https://img.haomeiwen.com/i4193251/b637b9377b14075e.jpg)
返回值存放x0中
![](https://img.haomeiwen.com/i4193251/0c8079ce735b1426.jpg)
w0存放10在新开辟的16个字节栈空间的第12个字节往后的4个字节,因为是int型
w1存放20在新开辟的16个字节栈空间的第8个字节往后的位置
![](https://img.haomeiwen.com/i4193251/9911bd7099addc86.jpg)
将w8+w9的值存放在w0中并返回,栈内存空间回收
2.自己实现汇编参数和返回值
![](https://img.haomeiwen.com/i4193251/602fe75c869efd8c.jpg)
x0为返回值
![](https://img.haomeiwen.com/i4193251/9c95a37591391d31.png)
3.若传入多个参数参数呢,超过八个呢?汇编是如何实现的,且看下篇博客分析
函数的局部变量
函数的局部变量放在栈里面!
网友评论