要回答上述问题,必须首先了解这样一个问题“我们写的代码是如何被计算执行的?”。
这就涉及到了程序的编译和装载。这里我们简单的说一下大致流程,代码首先要经过编译器(gcc/g++)编译链接后生成可执行文件,随后系统将可执行文件加载到内存,接下来CPU从内存中读取指令,数据等信息执行该程序。
从以上流程中,我们可以看出我们的代码经历了三个阶段:代码---》可执行文件----》进程(运行着的程序)。我们先给出正确答案:标识符只存在与代码和可执行程序阶段,在进程阶段是不存在的(也就是说在内存中不存在标识符)。
众所周知代码文件中肯定存在标识符。
1. 可执行文件中的标识符
接下来,我们分析可执行程序中是否存在标识符?首先我们了解一下可执行程序大致的文件结构。(详细内容请看https://www.jianshu.com/p/a9dfd55792e7)
在可执行文件中,标识符存储在了.shstrtab中
.shstrtab: 字符串表。在ELF文件中用到了很多字符串,比如段名,变量名等。当 ELF 文件的其它部分需要引用字符串时,只需提供该字符串在字符串表中的位置索引即可。
这样做的目的就是为了调试程序,因此我们可以在调试器中看到标识符与其值之间的对应关系。
2.标识符是否会被加载到内存中?
答案当然是表示符不会加载到内存中。首先,先看一段代码
int g(int x)
{
return x + 2017;
}
编译后:
g:
.LFB0:
.cfi_startproc
pushl %ebp
.cfi_def_cfa_offset 8
.cfi_offset 5, -8
movl %esp, %ebp
.cfi_def_cfa_register 5
movl 8(%ebp), %eax
addl $2017, %eax
popl %ebp
.cfi_restore 5
.cfi_def_cfa 4, 4
ret
.cfi_endproc
.LFE0:
.size g, .-g
.globl f
.type f, @function
以“.”开头的行代表链接有关的代码,删除后是:
g:
pushl %ebp
movl %esp, %ebp
movl 8(%ebp), %eax
addl $2017, %eax
popl %ebp
ret
查看这一看:
movl 8(%ebp), %eax
这一行就表示将x从栈里取出来放在eax中。X的表示形式为栈址(%ebp)加偏移量。根本没有出现x(g其实也是不存在的,这只是个tag,为了简写汇编程序的。变成机器码后就相当于没有g了)
总结:标识符的根本就是不存在的啊,这些标识符就是栈址 + 偏移的形式。
网友评论