美文网首页
iOS逆向-02:函数本质

iOS逆向-02:函数本质

作者: 恍然如梦_b700 | 来源:发表于2021-04-30 01:24 被阅读0次

关于CPU的补充

寄存器

CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。

CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。

对于arm64系的CPU来说, 如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。

高速缓存

iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB,2级缓存的容量8M.

CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成).CPU直接从高速缓存依次读取指令来执行.

寄存器的补充

数据地址寄存器

数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。
ARM64中

  • 64位: X0-X30, XZR(零寄存器)
  • 32位: W0-W30, WZR(零寄存器)

注意:
之前讲解8086汇编中有一种特殊的寄存器段寄存器:CS,DS,SS,ES四个寄存器来保存这些段的基地址,这个属于Intel架构CPU中.在ARM中并没有

浮点和向量寄存器

因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数

  • 浮点寄存器 64位: D0 - D31 32位: S0 - S31

现在的CPU支持向量运算.(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器.

  • 向量寄存器 128位:V0-V31

  • 栈:是一种具有特殊的访问方式的存储空间(后进先出, Last In Out Firt,LIFO) [图片上传失败...(image-bc2390-1619709949042)]

SP和FP寄存器

  • sp寄存器在任意时刻会保存我们栈顶的地址.

  • fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!

    注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
    ARM64里面 对栈的操作是16字节对齐的!!,这也是对象在alloc时开辟的内存空间要16字节对齐的原因

函数调用栈

常见的函数调用开辟和恢复的栈空间

sub    sp, sp, #0x40             ; 拉伸0x40(64字节)空间
stp    x29, x30, [sp, #0x30]     ;x29\x30 寄存器入栈保护
add    x29, sp, #0x30            ; x29指向栈帧的底部
... 
ldp    x29, x30, [sp, #0x30]     ;恢复x29/x30 寄存器的值
add    sp, sp, #0x40             ; 栈平衡
ret

关于内存读写指令

注意:读/写 数据是都是往高地址读/写

str(store register)指令

将数据从寄存器中读出来,存到内存中.

ldr(load register)指令

将数据从内存中读出来,存到寄存器中

此ldr 和 str 的变种ldp 和 stp 还可以操作2个寄存器.

堆栈操作练习

使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.

sub    sp, sp, #0x20    ;拉伸栈空间32个字节
stp    x0, x1, [sp, #0x10] ;sp往上加16个字节,存放x0 和 x1
ldp    x1, x0, [sp, #0x10] ;将sp偏移16个字节的值取出来,放入x1 和 x0

bl和ret指令

bl标号

  • 将下一条指令的地址放入lr(x30)寄存器
  • 转到标号处执行指令


    image.png

ret

  • 默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下条指令地址!

ARM64平台的特色指令,它面向硬件做了优化处理的

x30寄存器

x30寄存器存放的是函数的返回地址.当ret指令执行时刻,会寻找x30寄存器保存的地址值!,也就是说下一条指令的地址

注意:在函数嵌套调用的时候.需要将x30入栈!也就是现场保护

函数的参数和返回值

ARM64下,函数的参数是存放在X0到X7(W0到W7)这8个寄存器里面的.如果超过8个参数,就会入栈.
函数的返回值是放在X0 寄存器里面的.

函数的局部变量

函数的局部变量放在栈里面!

.text
.global _A,_B
_A:
    mov x0,#0x10
    mov x1,#0x00
    add x1, x0, #0x12
    mov x0,x1
    bl _B
    mov x0,#0x0
    ret

_B:
    sub sp,sp, #0x20 //在原有的sp-0x20箱低地址拉伸,赋值给sp
    stp x0,x1,[sp, #0x10]//[]表示寻址 sp + 10 x0x1存入内存
    ldp x1,x0,[sp, #0x10]//反着取交换了
    add sp,sp, #0x20//平衡栈
    ret

_C:
    //sub sp,sp,#0x10
    //str x30,[sp]
    str x30,[sp,#-0x10]!
//就相当于先将sp-0x10,然后将x30赋值到sp里面去,再讲sp的值给sp ! 相当于-=
    mov x0, #0xa
    bl _D
    mov x0, #0xb
  //  ldr x30,[sp]//将sp给30
    //  add sp,sp,#0x10
    ldr x30,[sp],#0x10 //将sp的值读出来给x30,再将sp+0x10赋值给sp
    ret

_D:
    sub sp,sp,#0x10
    mov x0, #0xa
    add sp,sp,#0x10
    ret

上面的C和D我模拟了通过栈保存了lr寄存器,bl跳转执行ret之后,将当前栈中存储的lr赋值给lr,当前函数ret就会使用新的lr 找到回家的路也就是didload里bl的下一条指令。我画图分析一下

image.png

此外我们跟汇编走流程也能验证这个过程
上面的代码没有考虑参数,那么如果有参数又该如何实现呢,我们看看系统如何做的


image.png
image.png

这两个参数是局部变量,保存在了w0和w1寄存器中,w 32位的寄存器,后32位,因为int 是 4 字节,也就是32位,然后看看内部实现


image.png
首先拉伸栈空间,这个栈空间的大小其实编译器已经算好了
将w0和w1的值存入到sp + 0xc 和 sp + 0x8 内存中
然后再读出来 w8 和w9,然后w8+w9值存到w0中
我们看到返回值存到了w0中,那么我们自己来实现一下
_sum:
    add w0,w0,w1
    ret

既然返回值存在w0中,我就可以直接这么写


image.png

x0到x7存的参数,如果大于8个参数,那么是如何存储的呢?示例代码:

int funcSum(int a, int b ,int c, int d, int e, int f, int g, int h, int i) {
    return a+b+c+d+e+f+g+h+i;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    funcSum(1, 2, 3, 4, 5, 6, 7, 8, 9);
}

看一下汇编


image.png

可以看到前八个参数的值给了w0-w7寄存器,x8存储了sp,而w10为0x9也就是第九个参数,然后存到x8的栈内存中。
我们在step into 到funcSum中


image.png

通过上面的标注可以看到,返回结果存到了w0中,那么有个疑问,w8为什么取得是上个栈空间的数据呢,上一个占空间的数据会是第九个参数吗?
我们在看


image.png
我们可以看到,第九个参数其实存储到了sp的第一个位置,所以上面的问题就迎刃而解了,第九个参数保存在上一个函数的栈空间中。

那如果返回值大于八个字节呢?

image.png image.png

通过上面的流程,得出结论:
当返回值大于8个字节,返回值也用栈空间来做

局部变量也在栈空间里面

我们分一下下面代码

int funcB(int a,int b){
    int c = 6;
    int d = funcSum(a, b, c);
    int e = funcSum(a, b, c);
    return c+d+e;
}

int funcSum(int a,int b,int c){
    int d = a + b + c;
    printf("%d",d);
    return d;
}

- (void)viewDidLoad {
    [super viewDidLoad];
    funcB(1, 2);
}
image.png

结构:


image.png

总结:

  1. 函数
    函数调用栈
    arm64中栈是递减栈,向低地址拉伸
    sp 指向栈顶
    x29指向栈底,如果有嵌套调用,内部的局部变量需要借助x29来获取
  2. 参数与返回值
    x0-x7存参数,超过8个参数,入栈,存入当前栈空间
    返回值存到x0,超过8个字节,存在前一个函数的栈空间
  3. 拉伸栈空间
    x29 x30 入栈
    x29指向栈底

相关文章

  • iOS逆向-02:函数本质

    关于CPU的补充 寄存器 CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。 CPU的...

  • iOS逆向 02:函数本质(下)

    iOS 底层原理 + 逆向 文章汇总[https://www.jianshu.com/p/412b20d9a0f6...

  • iOS逆向 02:函数本质(上)

    iOS 底层原理 + 逆向 文章汇总[https://www.jianshu.com/p/412b20d9a0f6...

  • iOS逆向目录

    越狱最新进展 一.逆向基础 iOS逆向基础01-越狱iOS逆向基础02-编译&调试iOS逆向基础03-符号表iOS...

  • iOS-逆向02-函数本质

    《iOS底层原理文章汇总》[https://www.jianshu.com/p/15af435341ce] 关于C...

  • iOS逆向(二)函数本质

    概念 一、寄存器 1.数据地址寄存器 通常用来做数据计算的临时存储、累加、计数、地址保存等功能。定义这些寄存器的作...

  • iOS逆向:函数本质(上)

    本文的主要目的是理解函数栈以及涉及的相关指令 在讲函数的本质之前,首先需要讲下以下几个概念栈、SP、FP 常识 栈...

  • iOS逆向:函数本质(下)

    本文主要是讲解函数的参数、返回值、局部变量在汇编中是如何存储,以及CPSR标志寄存器 函数的参数和返回值 arm6...

  • iOS逆向之函数本质

    栈 栈:是一种具有特殊的访问方式的存储空间(后进先出, Last In Out Firt,LIFO) SP和FP寄...

  • iOS逆向之函数本质(三)

    关于CPU的补充 寄存器 CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。 CPU的...

网友评论

      本文标题:iOS逆向-02:函数本质

      本文链接:https://www.haomeiwen.com/subject/ruofrltx.html