美文网首页
Linux系统内存管理与分页机制

Linux系统内存管理与分页机制

作者: JamFF | 来源:发表于2021-03-25 09:36 被阅读0次

一、问题提出:

我们经常会使用malloc()以及free()函数进行堆区内存申请与释放。那么你是否会这样做:

int * p = malloc(0);// malloc分配了0个字节吗,如果是那么p指向谁呢,是NULL吗?
free(p);// 假如malloc分配了0个字节,p指向了NULL,那么free(NULL)不会出现段错误吗?

我想很少有人这样做,因为除了喜欢“打破砂锅问到底”,或者经常使用测试一些特例的方法去学习的的人,一般人不会注意到这个问题到底是怎样的结果。

我们可以做一个简单的测试:

/*****************************
**
**2016年12月25日16:09:44
**测试环境:Redhat 6.4
**测试int * p = malloc(0);p是否指向NULL
**
*****************************/
#include<stdio.h>
#include<stdlib.h>
int main(void){
    int * p = (int *)malloc(0);
    printf("%d,%d\n",*(p),*(p+1024));
    free(p);
    int * q = NULL;
    printf("%d,%d\n",*(q),*(q+1024));
    return 0;
}

在测试中我们可以看到,q指针指向NULL,所以对其取值会发生段错误,而对于p来说,虽然它申请了0字节的空间,但是free()释放以及取值时都不会发生段错误(读者可以拆开测试,否则有人会怀疑是free()引发的的段错误,而不是*q取q值时引发的段错误)。

由此可见,malloc(0)分配的不是0个字节,p也不是指向NULL。那malloc(0)分配了几个字节?并且为什么 *(p+1024)也不会越界发生段错误呢?这就是内存的分页机制与内存管理所决定。

另外,在stackoverflow上也有相关的回答:What's the point of malloc(0)?

二、虚拟内存(Virtual Memory)与物理内存(Physical memory):

1、内存类型细分:

内存由于用途不同,分类也不尽相同,一般我们对于内存的分类也就这几种:栈区(stack area)、堆区(heap area)、全局区(静态区)(存放全局变量与静态变量static)、BSS段(存放未初始化的全局变量,未初始化的全局变量默认值为0)、文字常量区、数据区(data area)、代码区(code area)等。

关于BSS段存储的未初始化全局变量的值,我们可以测试一下,如下(i为未初始化的全局变量,其值为0):

而关于这些不同类型的内存地址区域,其所在位置如下图所示:

2、Linux内存分配时的maps文件:

关于上面所讲内存划分的各段地址位置关系,我们可以用程序进行测试:

# include<stdio.h>
# include<stdlib.h>
int num1;/*BSS段*/
int num2 = 2;/*全局区*/
char * str1 = "str1";/*文字常量区*/
int main(void){
    printf("%d\n",getpid());/*获取当前进程id号*/

    int num3 = 3;/*栈区*/
    static int num4 = 4;/*全局区*/
    const int num5 = 5;/*栈区*/
    char * str2 = "str2";/*文字常量区*/
    char str3[] = "str3";/*栈区*/
    int * p = malloc(sizeof(0));/*&p在栈区,p在堆区*/

    printf("num1:%p\nnum2:%p\nnum3:%p\nnum4:%p\nnum5:%p\n",&num1,&num2,&num3,&num4,&num5);
    printf("str1:%p\nstr2:%p\nstr3:%p\n",str1,str2,str3);
    printf("&p:%p\np:%p\n",&p,p);

    while(1){}/*死循环以保证进程不会结束,方便查看/proc/pid/maps文件*/

    free(p);

    return 0;
}

我们可以查看/proc/pid/maps文件(pid表示以进程id号命名的文件名),其中有该pid的内存分配的详细情况。注意:proc下各个进程目录占磁盘大小都是0(读者可自行测试),因为其数据都存在于内存,该文件只是一个映射。实际不存在,如果该进程消亡,pid这个目录及其子目录将会消失。所以可以用循环测试,并且maps文件中的内存地址为已经映射了物理内存的虚拟内存地址。我们先运行程序,如下所示(获得当前进程pid为5052):

我们可以“vim /proc/5052/maps”查看该文件下的内存分配情况
cd proc/5052:

vim maps:

3、内存地址映射关系:

每个进程都设定了4G的虚拟内存地址(不是真实的地址,只是一个编号)。虚拟内存开始时不对应任何内存,直接使用会引发段错误,不进入内核就接触不到物理内存地址,只会接触到虚拟内存地址。虚拟内存地址必须映射物理内存(或者硬盘上的文件)以后才能存储数据(数据存储在物理内存上,打印地址为虚拟内存地址)。而内存分配其实就是虚拟内存地址映射物理内存的过程,内存回收则是解除映射关系的过程。

虚拟内存中,0~3G 是用户空间,3~4G 是内核空间。用户层不能直接访问内核层,可以通过Unix/Linux的系统函数访问内核层。我们通常所讲内存地址,其实都不是真正意义上的物理内存(PC机上内存硬件)的地址,而是虚拟内存地址。两个不同的进程,当其某个变量地址一样(虚拟),但是物理地址并不一样。

映射关系如图所示(A、B进程均已映射物理内存,而C进程未映射物理内存,注意:虚拟内存一般并不会全部映射):

对于不同进程的同一地址,是虚拟地址而不是物理地址我们可以做个测试:

由于两个不同进程有各自的虚拟内存,打印的进程1的内存地址为虚拟内存地址,而进程2的相同的虚拟内存地址,不能操作进程1的虚拟内存地址已映射的物理内存地址,并且进程2的*p并没有映射物理内存地址,所以进程2运行出现段错误。

三、内存分页机制(Memory Paging Mechanism)与malloc详解:

1、内存管理页机制:

最小存储单位是一个字节(1B),最小管理单位是一页(4KB),虚拟内存地址连续时物理内存地址可以不连续,即使一次分配6000字节(不到两页也分配两页),两个内存页物理地址可能不挨着。多次申请内存时,如果之前分配的页内存没用完,则不再分配,除非之前分配的内存页用完才继续映射新的一页。getpagesize()可以获取当前内存页的大小。硬盘也是如此(硬盘上称为Block块):即使一个.txt文件中只有一个“a”字母,其大小为1B而其占用大小为4K。

如图所示:test.txt文件中仅仅有14个 'a' 字符,但是现实其占用磁盘大小仍然是4K(一页):

Windows下也有相同的机制(文件大小小于实际占用空间大小,占用大小是磁盘分块单位的整数倍):

2、为什么要有这种机制(一次性最少分配1页(4K))?

一句话:为了方便管理。
不可能进程每次申请一次系统就需要向其分配一次。(就像你和弟弟管妈妈要一块钱买辣条,你妈妈给了你俩十块钱说:“一周内都不要给我再要”,其实就算你一周内再向她要,妈妈也会给你,她只是不想你们俩不停地要而已,这就是管理)。系统也是这样,它一次分配至少一页,在你(进程)没用完之前它都不会再给你分配,而当你用完分配的内存之后,就需要重新分配了。

就拿malloc来说,第一次malloc(0)时一次性映射33个内存页(Redhat6.4),关于这点我们测试一下:

只malloc()了一次,分配了33页,对前33页操作不会出错,但是一超过33页(p相对位置不为0,p+33*1024为虚拟地址的第34页)就产生了段错误,因为超过的虚拟内存地址并没有映射(分配)物理内存。

3、malloc(0)分配了多少内存?

例如:malloc(sizeof(int))申请了4字节,系统却给它33页,而malloc()给变量分配给变量内存时,除了数据区域外,还额外需要保存一些信息。底层有一个双向链表保存额外信息。malloc()给指针了12个字节,其中4个字节存放数据,另外8个存放其他信息或者空闲,如果将12个字节中前(低位)几个字节清空或者进行修改,free就可能出错,因为free只有首地址不能释放,还得需要额外附加信息(如malloc分配的长度)。(低八位是附加数据,高四位是int型数据)

就拿我们测试内存划分时的例子来说(仅借用地址划分关系,程序不同):

p申请了0个字节,但是系统分配了 0x08fa9000~0x08fca000 之间的地址空间,共33个内存页。
0x08fca000-0x08fa9000=21000H=(2^{17} + 2^{12})Byte=(2^7 + 2^2)KB=(2^5 + 1)页 = 33页

而p指向的地址为0x08fa9008(偏移了8个字节),直接指向高四位的4个字节(共12字节)。

如果我们将低八位的数据进行清空或者修改(修改任意个字节),free就有可能失败,测试如下:

将p的低四位数据清零之后,附加信息出错,free失败,出错结果如下:

作者:Apollon_krj
链接:https://blog.csdn.net/apollon_krj/article/details/53869173
来源:CSDN
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相关文章

  • Linux系统内存管理与分页机制

    一、问题提出: 我们经常会使用malloc()以及free()函数进行堆区内存申请与释放。那么你是否会这样做: 我...

  • 内存管理

    面试问了解Linux内存管理吗?10张图给你安排得明明白白! 史上最全linux内存管理 linux分段和分页机制...

  • Linux内存管理--地址映射

    在Linux系统内内存是通过分页机制进行管理的。CPU的页式内存管理单元负责把一个线性地址最终翻译为一个物理地址。...

  • 内存方面优化分析(二)

    安卓内存管理机制 Android是一个基于Linux实现的操作系统,并对Linux的内存管理机制进行了优化。从操作...

  • Huge page(大页)

    linux的内存管理采取的是分页存取机制,为了保证物理内存能得到充分的利用,内核会按照 LRU 算法在适当的时候将...

  • 启动优化之二进制重排

    涉及的基础知识点 虚拟内存和分页 我们知道,现代操作系统一般都采用虚拟内存管理机制,用分段(segment)和分页...

  • Android内存管理机制

    Android内存管理机制 [转载自大果仁Pareto的 android内存管理机制] 1、基于Linux内存管理...

  • Android 内存管理机制

    前言:Android系统是基于Linux内核开发的操作系统,而Linux系统有其独到的内存管理机制,会在进程活动停...

  • Android 内存优化

    Android 内存管理机制 内存管理 进程(由Application FrameWork和Linux内核管理) ...

  • 1.用户空间内存之缺页分析

    在linux中使用了分页机制,分页机制把线性地址空间分成固定大小的页面,如果包含线性地址的页面当前不在物理内存中,...

网友评论

      本文标题:Linux系统内存管理与分页机制

      本文链接:https://www.haomeiwen.com/subject/hlzhcltx.html