C++ or C
这里讨论的是 C++, 在C中内存布局差不多,但是也不尽相同。如一个空的struct,c++中大小为1, C中却大小为0.
struct 的最小大小为1
C++中每个对象必须有个唯一的地址,所以每个对象的大小必须不能为0,因此一个 struct 的最小大小为 1. 一个例子是一个空struct:
struct EmptyStruct {};
布局流程
一个 struct 的内存布局流程可以简化为下面几步:
- struct 放到地址0上
2.struct 的所有成员顺序地依次放置到自己的偏移位置上
3.所有成员放置完毕,对struct的内容大小(最后一个成员的终了位置)进行对齐,计算出新大小
流程中涉及到两点:
- 如何确定一个成员的放置起始位置
2.如何最后对struct的内容大小进行对齐
成员的起始位置
当放置完上一个成员之后,对接下来的成员放置位置是有要求的,要求这个位置偏移(对于struct的起始位置)必须是这个成员的内部最大pod类型的大小的倍数。
成员的内部最大pod类型可以分成集中情况来讨论:
第一种是这个成员就是基本的pod类型(int,char,double,...) ,那么其内部最大pod类型大小自然是其本身成员的大小了。
第二种是这个成员是struct类型,其内部最大pod类型为struct内部的各个成员的内部最大pod类型中最大的那个(有个递归了)。
第三种是数组,数组的内存布局要求是,每个数组成员之间无空隙排列的,没有填充字节。所以数组的总大小是数组长度乘以每个数组成员的大小。内部最大pod类型的大小为数组成员内部的最大pod类型大小(有个递归了)。
伪代码如下:
function maxInnerUnitSize(data)
if data 是 pod类型:
return sizeof(pod类型)
else if data 是 struct 类型:
return max(map(data.members, maxInnerUnitSize))
else if data 是 数组类型:
return maxInnerUnitSize(data[0])
end
在上个放置成员尾部和当前成员起始位置之间如果有间隙,那么编译器会填充无效字节。
然后就可以把当前成员放置进去,放入的大小为当前成员的总大小。一个数组的总大小计算伪代码:
function dataSize(data)
if data 是 pod类型:
return sizeof(pod类型)
else if data 是 struct 类型:
return struct 的大小
else if data 是 数组类型:
return 数组长度 * sizeof(data[0])
end
struct 的大小对齐
成员都放置完毕之后,struct的内容大小有个规则,是必须是内部最大pod类型的大小的倍数。没错就是上面那个 maxInnerUnitSize。
然后在最后一个成员末尾到struct的新大小末尾会填充字节(如果有空隙的话)。
举个例子:
struct AAA {
char a[3];
int64_t b;
char c;
};
a 的地址为 0, 占3个字节,b的地址必须为8的倍数,所以编译器填充5个字节,然后b从地址8处开始放置,占用8个字节, c 放置在地址16处, 占用1个字节。整个struct内容大小为17, 内部最大的pod类型大小为8,所以调整到8的倍数,struct 大小调整为24.
#pragma pack(n) 的影响
pack 的参数n,有1,2,4,8,16, 原则是2的次幂。这个参数影响的是上面流程中的内部最大pod类型大小。影响是从正常流程算出的大小,和pack(n) 指定的大小选取一个小的来布局。
#pragma pack(4)
struct AAA {
char a[3];
int64_t b;
char c;
};
a放置在地址0处,占用3个字节,接下来b的内部最大pod大小为8,选取指定的4, 所以b放置在地址4处,占用8个字节, c放置在地址9处,占用1个字节。struct内容区域大小为10,需要调整为 4 的倍数(8和指定的4选小的),所以大小调整为12.
网友评论