计算机内存对齐知识记录

作者: 恋空K | 来源:发表于2020-04-26 19:30 被阅读0次

内存对齐
计算机内存对齐知识记录
iOS底层 - 内存字节的对齐规则
iOS 结构体内存对齐浅析
内存对齐
为什么要内存对齐？
内存对齐
内存对齐
内存对齐
iOS底层之内存对齐

在32位系统中，假如一个int变量在内存中的地址是0x00ff42c3,因为int是占用4个字节，所以它的尾地址应该是0x00ff42c6，这个时候CPU为了读取这个int变量的值，就需要先后读取两个word大小的块，分别是0x00ff42c0_{0x00ff42c3和0x00ff42c4}0x00ff42c7，然后通过移位等一系列的操作来得到，在这个计算的过程中还有可能引起一些总线数据错误的。但是如果编译器对变量地址进行了对齐，比如放在0x00ff42c0，CPU就只需要一次就可以读取到，这样的话就加快读取效率。

2、结构体数据对齐
结构体数据对齐，是指结构体内的各个数据对齐。在结构体中的第一个成员的首地址等于整个结构体的变量的首地址，而后的成员的地址随着它声明的顺序和实际占用的字节数递增。为了总的结构体大小对齐，会在结构体中插入一些没有实际意思的字符来填充（padding）结构体。

   在结构体中，成员数据对齐满足以下规则：
    a、结构体中的第一个成员的首地址也即是结构体变量的首地址。
    b、结构体中的每一个成员的首地址相对于结构体的首地址的偏移量（offset）是该成员数据类型大小的整数倍。
    c、结构体的总大小是对齐模数（对齐模数等于#pragma pack(n)所指定的n与结构体中最大数据类型的成员大小的最小值）的整数倍。

7: struct

8: {
9: char a;
10: int b;
11: short c;
12: char d;
13: }dataAlign;
14:
15: struct
16: {
17: char a;
18: char d;
19: short c;
20: int b;
21:
22: }dataAlign2;

仔细观察，会发现虽然是一样的数据类型的成员，只不过声明的顺序不同，结构体占用的大小也不同，一个8-byte一个12-byte。为什么这样，下面进行具体分析。
首先来看dataAlign2，第一个成员的地址等于结构体变量的首地址，第二个成员char类型，为了满足规则b，它相对于结构体的首地址的偏移量必须是char=1的倍数，由于前面也是char，故不需要在第一个和第一个成员之间填充，直接满足条件。第三个成员short=2如果要满足规则b，也不需要填充，因为它的偏移量已经是2。同样第四个也因为偏移量int=4，不需要填充，这样结构体总共大小为8-byte。最后来验证规则c，在VC中默认的#pragma pack(n)中的n=8，而结构体中数据类型大小最大的为第四个成员int=4，故对齐模数为4,并且8 mode 4 = 0，所以满足规则c。这样整个结构体的总大小为8。

对于dataAlign，第一个成员等于结构体变量首地址，偏移量为0，第二个成员为int=4，为了满足规则b，需要在第一个成员之后填充3-byte，让它相对于结构体首地址偏移量为4，结合运行结果，可知&dataAlign.a = 0x01109140，而&dataAlign.b = 0x01109144，它们之间相隔4-byte，0x01109141~0x01109143三个字节被0填充。第三个成员short=2，无需填充满足规则b。第四个成员char=1，也不需要填充。结构体总大小相加4 + 4 + 2 + 1 = 11。同样最后需要验证规则c，结构体中数据类型大小最大为第二个成员int=4，比VC默认对齐模数8小，故这个结构体的对齐模数仍然为4，显然11 mode 4 != 0，故为了满足规则c，需要在char后面填充一个字节，这样结构体变量dataAlign的总大小为4 + 4 + 2 + 2 = 12。

一个字节对应一个地址。
首先我们要清楚结构体struct中的成员在内存中的分配是连续的，struct内的首地址也就是struct内第一个数据成员的地址，换句话说struct内第一个数据成员离struct开始的距离offset = 0。

2）规则：

结构体变量的首地址是有效对齐值（对齐单位）的整数倍。

结构体第一个成员的偏移量（offset）为0，以后每个成员相对于结构体首地址的 offset 都是该成员大小与有效对齐值中较小那个的整数倍，如有需要编译器会在成员之间加上填充字节。

结构体的总大小为有效对齐值的整数倍，如有需要编译器会在最末一个成员之后加上填充字节。

结构体内类型相同的连续元素将在连续的空间内，和数组一样。

1.包含指针类型的情况。只要记住指针本身所占的存储空间是4个字节就行了，而不必看它是指向什么类型的指针。

大端模式，是指数据的高字节保存在内存的低地址中，而数据的低字节保存在内存的高地址中，这样的存储模式有点儿类似于把数据当作字符串顺序处理：地址由小向大增加，而数据从高位往低位放；这和我们的阅读习惯一致。
小端模式，是指数据的高字节保存在内存的高地址中，而数据的低字节保存在内存的低地址中，这种存储模式将地址的高低和数据位权有效地结合起来，高地址部分权值高，低地址部分权值低。

下面以unsigned int value = 0x12345678为例，分别看看在两种字节序下其存储情况，我们可以用unsigned char buf[4]来表示value