Linux下汇编和C同步使用

作者: 海人为记 | 来源:发表于2016-11-09 17:29 被阅读197次

首先我们先编写汇编

extern choose   ; int choose(int a, int b)
[section .data];  数据在此
num1st  dd  3
num2nd dd 4
[section .text] ; 代码在此

global _start   ;  我们必须导出_start这个入口，以便让连接器识别
global myprint  ; 导出这个函数为了让 bar.c 使用

_start:
    push dword [num2nd] ;
    push dword [num1st]  ;

    call choose  ;  | choose(num1st, num2nd)
    add esp,  8
    
    mov ebx, 0
    mov eax, 1    ;   sys_exit
    int 0x80         ;  系统调用

; void myprint(char * msg, int len)
myprint:
    mov edx,  [esp + 8]  ; len
    mov ecx,  [esp + 4]  ; msg
    mov ebx,  1
    mov eax,   4   ; sys_write
    int 0x80          ; 系统调用
    ret

上述代码中需要说明的有三点：

由于在bar.c中用到函数mprint()，所以要用关键字global将其导出。
由于用到本文件外定义的函数choose()，所以要用关键字extern声明。
不管是myprint()还是choose()，遵循的都是C调用约定（C Calling Convention），后面的参数先入栈，并由调用者（Caller）清理堆栈。

C语言代码，其中包含函数myprint()的声明和函数choose()的主体。

void myprint(char * msg, int len);
int choose(int a, int b)
{
    if (a >= b) {
        myprint("the 1st one\n", 13);
    } else {
        myprint("the 2nd one\n", 13);
    }
    return 0;
}

编译链接和执行的过程：

~$  ls
bar.c     foo.asm
~$ nasm -f elf -o foo.o foo.asm
~$ gcc -c -o bar.o bar.c
~$ ld -s -o foobar foo.o bar.o   
~$ ls
bar.c bar.o foo.asm foobar foo.o
~$ ./foobar
the 2nd one

如果当我们执行上面的操作到 ld -s foo.o bar.o -o foobar 会产生 ld: i386 architecture of input file `foo.o’ is incompatible with i386:x86-64 output错误意思是nasm编译产生的是32位的目标代码，gcc在64位平台上默认产生的是64位的目标代码，这两者在链接的时候出错，gcc在64位平台上默认以64位的方式链接。

方法一：

让gcc产生32位的代码，并在链接的时候以32位的方式进行链接
在这种情况下只需要修改编译和链接指令即可，具体如下：
32位的编译链接指令

$ nasm -f elf foo.asm -o foo.o
$ gcc -m32 -c bar.c -o bar.o
$ ld -m elf_i386 -s foo.o bar.o -o foobar
$ ./foobar
the 2nd one

方法二：

让nasm以64位的方式编译产生目标代码，并让gcc的链接器以默认的方式链接
但是第二种方法并不是仅仅更改nasm的编译方式那么简单，因为64位平台跟32位平台有很大的不同，包括参数的传递，指令集等。所以如果怕麻烦的话完全可以使用第一种方法，让gcc产生32位的目标代码，因为32位的代码可以运行在64位的平台上，这应该就是所谓的向上兼容。不过64位将来应该会是主流，所以研究一下还是很有必要的。

首先对gcc产生的32位于64位的汇编语言进行对比：
32位
gcc -m32 -s -o bar.o bar.c

 /************** 32 位的汇编语言 *************/ choose:  .LFB0:     .cfi_startproc     
pushl    %ebp     
.cfi_def_cfa_offset 8     
.cfi_offset 5, -8     
movl    %esp, %ebp     
.cfi_def_cfa_register 5     
subl    $24, %esp     
movl    8(%ebp), %eax     
cmpl    12(%ebp), %eax     
jl    .L2    
 movl    $13, 4(%esp)     
movl    $.LC0, (%esp)     
call    myprint     
jmp    .L3  
.L2:     
movl    $13, 4(%esp)     
movl    $.LC1, (%esp)     
call    myprint
 
movl 8(%ebp), %eax
cmpl 12(%ebp), %eax
jl .L2
movl $13, 4(%esp)
movl $.LC0, (%esp)

上面只取了我们感兴趣的地方：ebp指向的是刚进入choose函数的堆栈栈顶指针，此时只想的是刚入栈的ebp的值，ebp+4指向的函数调用入栈的ip地址（这里应该是段内调用，具体原因不太清楚，因为两个文件之间调用函数属于段内还是段外，我真的不清楚，如果你知道，可以告诉我），ebp+8指向的是调用者压栈的第二个参数，也是从左边数第一个参数，ebp+12 是调用者压栈的第一个参数，也就是从左边数第二个参数。这样我们知道了c语言的参数传递机制，就能编写相应的汇编程序调用C语言了，而C 语言调用汇编函数则以此类推，先将第二个参数压栈，再将第一个参数压栈。不再赘述。

（例： void fun(int a, int b) 函数在调用fun时首先将参数b 压栈，然后将参数 a压栈，这样fun 函数在取参数的时候就能先取a了，然后再取b，因为堆栈是先入后出。如果这样你还不明白，建议你看一下赵迥老师的linux 0.11内核完全剖析的第三章。）

(注：rax:64位，eax：32位 ax：16位

movl：移动32位，movq：移动64位，movd：移动16位，movb：移动8位

其他带标志的指令类似。)

64位
gcc -c -o bar.o bar.c (64位的操作系统默认)

 /************** 64位的汇编程序 ***********/   
choose:  
.LFB0:     
.cfi_startproc     
pushq    %rbp     
.cfi_def_cfa_offset 16     
.cfi_offset 6, -16     
movq    %rsp, %rbp     
.cfi_def_cfa_register 6     
subq    $16, %rsp     
movl    %edi, -4(%rbp)     
movl    %esi, -8(%rbp)     
movl    -4(%rbp), %eax     
cmpl    -8(%rbp), %eax     
jl    .L2     
movl    $13, %esi     
movl    $.LC0, %edi     
call    myprint     
jmp    .L3  
.L2:     
movl    $13, %esi     
movl    $.LC1, %edi     
call    myprint

movl %edi, -4(%rbp)
movl %esi, -8(%rbp)
movl -4(%rbp), %eax
cmpl -8(%rbp), %eax
jl .L2
movl $13, %esi
movl $.LC0, %edi

注意64位下的参数传递有了改变，而且寄存器也有了改变，不过我们既然使用了nasm汇编，对于64位寄存器的改变暂时不必操心，只需要先关心参数传递的格式。

可以看出参数传递不是用压栈的方式传递了，而是使用的寄存器来传递给被调用者，再由被调用者将其压栈使用。上述代码显示先将第一个参数给edi，然后由被调用者压入-4（%rbp），然后再将第二个参数给esi，由被调用者要入-8（%rbp），这一点倒是和32位下参数的入栈方式一致。

至于用寄存器传递函数参数取代用堆栈传递函数参数的原因，个人感觉是函数的调用者不用再操心入栈和释放栈了，完全由被调用者操心，至少我在函数的调用者里面经常是记得给函数参数入栈，但是函数调用完成后却忘记了把栈恢复。

这样我们就能根据上述规则来修改我们的foo.s,使其能够与64位的gcc产生的目标代码链接在一起。

64位模式下的foo.asm

extern choose   ; int choose(int a, int b)

num1st  dd  3
num2nd dd 4


global _start   ;  我们必须导出_start这个入口，以便让连接器识别
global myprint  ; 导出这个函数为了让 bar.c 使用

_start:
    mov edi, [num2nd] ;
    mov esi, [num1st]  ;

    call choose  ;  | choose(num1st, num2nd)
    
    mov ebx, 0
    mov eax, 1    ;   sys_exit
    int 0x80         ;  系统调用

; void myprint(char * msg, int len)
myprint:
    ;mov edx,  [esp + 8]  ; len  
    ;mov ecx,  [esp + 4]  ; msg
    mov edx, esi
    mov ecx, edi
    mov ebx,  1
    mov eax,   4   ; sys_write
    int 0x80          ; 系统调用
    ret

网友评论

本文标题：Linux下汇编和C同步使用

本文链接：https://www.haomeiwen.com/subject/qkqtpttx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Linux下汇编和C同步使用

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读