C语言到汇编-函数与程序结构1

作者: 故事观察日记 | 来源:发表于2020-04-13 18:12 被阅读0次

C语言到汇编-函数与程序结构1
C语言到汇编-函数与程序结构2
C语言到汇编-函数与程序结构3
Python基础（三）——程序结构
2. 指令集对CPU的意义
2级小知识
Linux入门第6天-Linux发展史及安装入门
重新学习 c 语言(3)- c语言特性(三)函数和程序结构
C语言到汇编-指针与数组1
Chapter 18 Runtime Environment

这章的知识点有：

1.函数的定义
2.函数的声明
3.作用域
4.头文件
5.静态变量
6.寄存器变量
7.程序块结构
8.初始化
9.递归
10.C预处理器

每一个知识点写一个程序例子，然后编译成汇编语言进行对比。
1.函数的定义

函数的定义形式如下： 
返回值类型 函数明(参数声明表) 
{ 
声明和语句 
}

C语言程序例子：

#include <stdio.h>

int a = 'a';
int b = 15;
int c = 17;

int f(int,int,int);

main(){
    f(a,b,c);
}

int f(int a,int b,int c)
{
    int x = a;
    int y = b;
    int z = c;
    print("%d", x);
    print("%d", y);
    print("%d", z);
    return x;
}

这个程序定义了一个函数f，并在main函数中进行了调用。下面看编译后的汇编程序：

    .file   "function.c"
    .intel_syntax
.globl _a
    .data
    .align 4
_a:
    .long   97
.globl _b
    .align 4
_b:
    .long   15
.globl _c
    .align 4
_c:
    .long   17
    .def    ___main;    .scl    2;  .type   32; .endef
    .text
.globl _main
    .def    _main;  .scl    2;  .type   32; .endef
_main:
    push    ebp
    mov ebp, esp
    sub esp, 24
    and esp, -16
    mov eax, 0
    add eax, 15
    add eax, 15
    shr eax, 4
    sal eax, 4
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp-4]
    call    __alloca
    call    ___main
    mov eax, DWORD PTR _c
    mov DWORD PTR [esp+8], eax
    mov eax, DWORD PTR _b
    mov DWORD PTR [esp+4], eax
    mov eax, DWORD PTR _a
    mov DWORD PTR [esp], eax
    call    _f
    leave
    ret
    .section .rdata,"dr"
LC0:
    .ascii "%d\0"
    .text
.globl _f
    .def    _f; .scl    2;  .type   32; .endef
_f:
    push    ebp
    mov ebp, esp
    sub esp, 24
    mov eax, DWORD PTR [ebp+8]
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp+12]
    mov DWORD PTR [ebp-8], eax
    mov eax, DWORD PTR [ebp+16]
    mov DWORD PTR [ebp-12], eax
    mov eax, DWORD PTR [ebp-4]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-8]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-12]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-4]
    leave
    ret
    .def    _print; .scl    2;  .type   32; .endef

可以看到，C程序中的函数f 对应汇编程序中的子程序_f 。具体分析一下代码，先看main 函数中：

_main:
    push    ebp
    mov ebp, esp
    sub esp, 24
    and esp, -16
    mov eax, 0
    add eax, 15
    add eax, 15
    shr eax, 4
    sal eax, 4
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp-4]
    call    __alloca
    call    ___main
    mov eax, DWORD PTR _c
    mov DWORD PTR [esp+8], eax
    mov eax, DWORD PTR _b
    mov DWORD PTR [esp+4], eax
    mov eax, DWORD PTR _a
    mov DWORD PTR [esp], eax
    call    _f
    leave
    ret

为了方便分析，画了一个内存图表格，左列是地址，右列是内存单元中存储的内容，每个单元格代表4个内存单元，也即32位。如图：

表格1

进入main 函数后，栈指针esp 指向栈底，即上图中的esp(1) 位置。（右侧单元格代表4个内存单元，栈指针esp 指的是第1个内存单元的地址）
然后开始执行代码：

    push    ebp
    mov ebp, esp
    sub esp, 24
    and esp, -16

执行第1行“push ebp”指令，栈指针esp 上移32位，来到表格1中的倒数第2行esp(2) 的位置，并将ebp 的值压入了右边栈内存；
执行第2行“mov ebp,esp”指令，把此时esp 的值赋给了ebp ，ebp 指向的位置和esp(2) 相同；
执行第3行“sub esp,24”指令，esp 向上移动24个内存单元，也即表格中的6个单元格，来到了表格1中第1行的位置；
第4行指令“and esp,-16”是将esp的后4位置0。（调整地址到可以被16整除的位置，属于编译器的内存优化指令，先不用管。）
后面的几行指令：

    mov eax, 0
    add eax, 15
    add eax, 15
    shr eax, 4
    sal eax, 4
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp-4]
    call    __alloca
    call    ___main

设置了eax寄存器的值，并把它存入了地址[ebp-4]中，暂时不知道什么作用，跳过。
接下来几行指令开始获取3个参数a b c的值，并将它们存入栈中：

    mov eax, DWORD PTR _c
    mov DWORD PTR [esp+8], eax
    mov eax, DWORD PTR _b
    mov DWORD PTR [esp+4], eax
    mov eax, DWORD PTR _a
    mov DWORD PTR [esp], eax
    call    _f

获取完参数后，最后一行准备调用子函数_f ，此时esp、ebp以及参数a b c的位置即如表格1中所示：

表格1

然后开始执行“call _f”指令，即将此时的指令寄存器eip 的值压入栈中，然后跳转到标号_f 处执行。参照表格2，此时栈指针esp 的位置在esp(1)处（只看表格上一半/粗体部分），如图：

表格2
进入子程序_f 部分代码：

_f:
    push    ebp
    mov ebp, esp
    sub esp, 24
    mov eax, DWORD PTR [ebp+8]
    mov DWORD PTR [ebp-4], eax
    mov eax, DWORD PTR [ebp+12]
    mov DWORD PTR [ebp-8], eax
    mov eax, DWORD PTR [ebp+16]
    mov DWORD PTR [ebp-12], eax
    mov eax, DWORD PTR [ebp-4]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-8]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-12]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-4]  //返回值x的值放在寄存器eax中。
    leave
    ret

(从上面两段汇编代码可以看出，处理参数使用的都是esp ，处理局部变量使用的都是ebp 。)
参考上文不难分析出，前9行代码执行后局部变量x y z以及寄存器esp、ebp的位置即如表格2中所示。
再看原C程序中的代码：

int f(int a,int b,int c)
{
    int x = a;
    int y = b;
    int z = c;
    print("%d", x);
    print("%d", y);
    print("%d", z);
    return x;
}

汇编程序_f 函数前9行执行后，相当于执行完上面C程序f函数的前3行，即：

    int x = a;
    int y = b;
    int z = c;

C程序接下来的3行是print 打印功能，对应汇编程序_f 函数中的代码为：

    mov eax, DWORD PTR [ebp-4]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-8]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print
    mov eax, DWORD PTR [ebp-12]
    mov DWORD PTR [esp+4], eax
    mov DWORD PTR [esp], OFFSET FLAT:LC0
    call    _print

第1、2行取出变量x 的值并当作参数存入[esp+4]位置，即表格2中的第2行“x/y/z”处，第3行将标号LC0处的内容存到[esp]位置，即表格中“x/y/z”的上面（表格中没写上），然后调用标准库中的_print子程序。后面几行代码类似，变量y和z作为参数的值都是存在表格2中的“x/y/z”处。
最后两行代码：

leave
ret

leave指令相当于下面两条指令：

mov esp,ebp
pop ebp

这两条指令执行后，esp 回到函数执行前的位置，即表格2中上面的esp(1)处。ret 指令执行后，函数_f 返回，则esp 回到函数调用前的位置，即表格2中“a”对应的esp 处。_main 函数中也有相同的leave 和ret 指令，_main中的leave 指令执行后，esp 回到表格2中最下面一行的esp(1)处（阴影部分），ret 指令指令后，esp 回到_main 函数执行之前的位置。
经过上面的分析，清楚了C语言函数执行过程中参数和局部变量在内存中的位置变化。不同编译器的细节处理虽然可能不同，但原理应该都类似。
好了，文章太长了，10个知识点只写了1个，这章后面的9个知识点下一篇文章再继续。最后，根据表格2，将汇编程序简化如下，方便对比（描述性代码，无法执行）：

_main:
......
    mov eax, _c
    mov [c], eax
    mov eax, _b
    mov [b], eax
    mov eax, _a
    mov [a], eax
    call    _f
    leave
    ret
LC0:
    .ascii "%d\0"
_f:
    mov eax, [a]
    mov [x], eax
    mov eax, [b]
    mov [y], eax
    mov eax, [c]
    mov [z], eax
    mov eax, [x]
    mov [esp+4], eax
    mov [esp], "%d\0"
    call    _print
    mov eax, [y]
    mov [esp+4], eax
    mov [esp], "%d\0"
    call    _print
    mov eax, [z]
    mov [esp+4], eax
    mov [esp], "%d\0"
    call    _print
    mov eax, [x]
    leave
    ret

（[a] [b] [c] [x] [y] [z] 对应表格2中的a b c x y z。）

C语言到汇编-函数与程序结构1
这章的知识点有：每一个知识点写一个程序例子，然后编译成汇编语言进行对比。1.函数的定义 C语言程序例子：这个程...
C语言到汇编-函数与程序结构2
这章的知识点有：上一篇学习了1.函数的定义，实际上也使用到了2.函数的声明。上一篇示例代码如下：其中下面这一行...
C语言到汇编-函数与程序结构3
经过前面的学习，这章还剩下两个内容：前面说过，编译过程可以分为“预处理、编译、汇编、连接”四个步骤。以下面程序为...
Python基础（三）——程序结构
与c语言类似，Python的程序结构包括分支结构、循环结构和函数。 1.分支结构语句为if....elif......
2. 指令集对CPU的意义
汇编语言与c语言等高级语言的差异汇编难写，c好写汇编无可移植性，c语言有一定的可移植性，Java等高级语言移植...
2级小知识
1.c程序 c语言程序结构有三种，顺序结构，循环结构（三种），选择结构（if，witch） 2.main函数每个...
Linux入门第6天-Linux发展史及安装入门
机器语言>汇编语言>高级语言（C语言、C++）汇编语言：1.难移植交叉编译：cross compile ker...
重新学习 c 语言(3)- c语言特性(三)函数和程序结构
（三）函数和程序结构 1.函数函数调用非常依赖编译实现,函数的参数和返回值一般存放在线程堆栈中. 对于c语言,函...
C语言到汇编-指针与数组1
指针是一种保存变量地址的变量。下面代码声明了指针变量p ，它的值是x 的地址：一元运算符&可用于取一个对象的地址...
Chapter 18 Runtime Environment
C语言转化为汇编语言 1. 初始化static变量 2. 函数函数部分分成三层：前置操作，内容主题和清理操作。...

C语言到汇编-函数与程序结构1

相关文章

C语言到汇编-函数与程序结构1

C语言到汇编-函数与程序结构2

C语言到汇编-函数与程序结构3

Python基础（三）——程序结构

2. 指令集对CPU的意义

2级小知识

Linux入门第6天-Linux发展史及安装入门

重新学习 c 语言(3)- c语言特性(三)函数和程序结构

C语言到汇编-指针与数组1

Chapter 18 Runtime Environment

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读