内存对齐

作者: guanjianhe | 来源:发表于2018-03-05 23:11 被阅读31次

    什么是内存对齐?先看下面的的结构体:

    struct TestStruct1
    {
       char c1;
       short s;
       char c2;
       int i;
    };
    

    假设这个结构的成员在内存中是紧凑排列的,假设c1 的地址是0,那么s 的地址就应该是1,c2 的地址就是3,i 的地址就是4。也就是c1 地址为00000000, s 地址为00000001, c2地址为00000003, i 地址为00000004。

    可是,我们在Visual C++6.0中写一个简单的程序:

    #include <stdio.h>
    
    struct TestStruct1
    {
       char c1;
       short s;
       char c2;
       int i;
    };
    
    void main()
    {
        struct TestStruct1 a;
    
        printf("c1 %p, s %p, c2 %p, i %p\n",
        (unsigned int)(void*)&a.c1 - (unsigned int)(void*)&a,
        (unsigned int)(void*)&a.s - (unsigned int)(void*)&a,
        (unsigned int)(void*)&a.c2 - (unsigned int)(void*)&a,
        (unsigned int)(void*)&a.i - (unsigned int)(void*)&a);
    }
    

    运行,输出:

    c1 00000000, s 00000002, c2 00000004, i 00000008

    为什么会这样?这就是内存对齐而导致的问题。

    1、为什么会有内存对齐?

    字,双字,和四字在自然边界上不需要在内存中对齐。(对字,双字,和四字来说,自然边界分别是偶数地址,可以被4 整除的地址,和可以被8 整除的地址。)无论如何,为了提高程序的性能,数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

    一个字或双字操作数跨越了4 字节边界,或者一个四字操作数跨越了8 字节边界,被认为是未对齐的,从而需要两次总线周期来访问内存。一个字起始地址是奇数但却没有跨越字边界被认为是对齐的,能够在一个总线周期中被访问。某些操作双四字的指令需要内存操作数在自然边界上对齐。如果操作数没有对齐,这些指令将会产生一个通用保护异常。

    双四字的自然边界是能够被16 整除的地址。其他的操作双四字的指令允许未对齐的访问(不会产生通用保护异常),然而,需要额外的内存总线周期来访问内存中未对齐的数据。

    缺省情况下,编译器默认将结构、栈中的成员数据进行内存对齐。因此,上面的程序输出就变成了:

    c1 00000000, s 00000002, c2 00000004, i 00000008

    编译器将未对齐的成员向后移,将每一个都成员对齐到自然边界上,从而也导致了整个结构的尺寸变大。尽管会牺牲一点空间(成员之间有部分内存空闲),但提高了性能。也正是这个原因,我们不可以断言sizeof(TestStruct1)的结果为8,在这个例子中,sizeof(TestStruct1)的结果为12。

    2、如何避免内存对齐的影响?

    那么,能不能既达到提高性能的目的,又能节约一点空间呢?有一点小技巧可以使用。比如我们可以将上面的结构改成:

    struct TestStruct2
    {
       char c1;
       char c2;
       short s;
       int i;
    };
    

    这样一来,每个成员都对齐在其自然边界上,从而避免了编译器自动对齐。在这个例子中,sizeof(TestStruct2)的值为8。

    除此之外我们还可以利用#pragma pack()来改变编译器的默认对齐方式(当然一般编译器也提供了一些改变对齐方式的选项,这里不讨论)。

    使用指令#pragma pack (n),编译器将按照n 个字节对齐。
    使用指令#pragma pack (),编译器将取消自定义字节对齐方式。

    #pragma pack (n)#pragma pack ()之间的代码按n 个字节对齐。但是,成员对齐有一个重要的条件,即每个成员按自己的方式对齐.也就是说虽然指定了按n 字节对齐,但并不是所有的成员都是以n 字节对齐。其对齐的规则是,每个成员按其类型的对齐参数(通常是这个类型的大小)和指定对齐参数(这里是n 字节)中较小的一个对齐,即:min( n, sizeof( item )) 。并且结构的长度必须为所用过的所有对齐参数的整数倍,不够就补空字节。看如下例子:

    #pragma pack(8)
    struct TestStruct4
    {
       char a;
       long b;
    };
    struct TestStruct5
    {
       char c;
       TestStruct4 d;
       long long e;
    };
    #pragma pack()
    

    留两个问题:

    1. sizeof(TestStruct5) = ?
    2. TestStruct5 的c 后面空了几个字节接着是d?
    • TestStruct4 中,成员a 是1 字节默认按1 字节对齐,指定对齐参数为8,这两个值中取1,a按1 字节对齐;成员b 是4 个字节,默认是按4 字节对齐,这时就按4 字节对齐,所以sizeof(TestStruct4)应该为8。
    • TestStruct5 中,c 和TestStruct4 中的a 一样,按1 字节对齐,而d 是个结构,它是8 个字节,它
      按什么对齐呢?对于结构来说,它的默认对齐方式就是它的所有成员使用的对齐参数中最大的一个,TestStruct4 的最大的对齐参数是4,所以,成员d 就是按4 字节对齐。成员e 是8 个字节,它是默认按8字节对齐,和指定的一样,所以它对到8 字节的边界上。这时,已经使用了12 个字节了,所以又添加了4 个空字节,从第16 个字节开始放置成员e。这时,长度为24,已经可以被8(成员e 按8字节对齐)整除。这样,一共使用了24 个字节。内存布局如下(*表示空闲内存,1 表示使用内存。单位为1byete):

    TestStruct4 的内存布局:1***,1111

    TestStruct5 的内存布局: 1***, 1***, 1111, ****,11111111

    这里有3点很重要:

    1. 每个成员分别按自己的方式对齐,并能最小化长度。
    2. 复杂类型(如结构)的默认对齐方式是它最长的成员的对齐方式,这样在成员是复杂类型时,可以最小化长度。
    3. 对齐后的长度必须是成员中最大的对齐参数的整数倍,这样在处理数组时可以保证每一项都边界对齐。

    后记,先给自己挖个坑,下次再来讨论

    __attribute__ ((packed))

    这个东东

    相关文章

      网友评论

        本文标题:内存对齐

        本文链接:https://www.haomeiwen.com/subject/jxskfftx.html