今天这里聊聊如何设计结构体,注意本文不介绍在C++中结构体和类具体有什么区别,本文所说的结构体是指只有数据字段不带任何函数的那种结构体。
当创建结构体的实例时,结构体的数据成员会按其声明的顺序连续存储。然而,这个声明的顺序也是有学问的,顺序不同结构体的大小可能有很大差别,数据成员的访问性能也可能会有很大区别!
这里涉及一个概念:内存对齐。关于内存对齐这里不深入讨论,只是简单介绍一下。
大多数编译器会对齐数据成员,会以四舍五入地址方式来优化数据的访问,如下表所示。
image这种内存对齐可能会在成员大小混合的结构体中产生未使用字节的空洞。
例如:
struct S {
short int a; // 2字节
// 6个空洞
double b; // 8
int d; // 4
// 4个空洞
};
S ArrayOfStructures[100];
这里,在a和b之间有6个未使用的字节,因为b必须从一个能被8整除的地址开始。
最后还有4个未使用的字节空洞。这样做的原因是,数组中S的下一个实例必须从一个能被8整除的地址开始,以便将其b成员以8对齐。
然而,如果改变一下结构体中数据成员声明的顺序,通过将最小的成员放在最后,未使用的字节数可以减少到2:
struct S {
double b; // 8
int d; // 4
short int a; // 2
// 2个空洞
};
S ArrayOfStructures[100];
这种重新排序使结构体变小了8个字节,那整个数组则变小了800个字节。
在此特性上,类和结构体相同。通过重新排序数据成员,结构体对象和类对象通常可以变得更小。如果类至少有一个虚成员函数,则在第一个数据成员之前或最后一个成员之后会有一个指向虚函数表的指针。该指针在32位系统中为4字节,在64位系统中为8字节。
如果不确定结构体或它的每个成员有多大,可以使用sizeof操作符进行一些测试。sizeof操作符返回的值包括对象末尾的任何未使用的字节(内存对齐后的字节数)。
也可以无脑使用紧凑型结构体?
还有一个知识点:
如果数据成员相对于结构体或类开头的偏移量小于128,则访问数据成员的代码会更加紧凑,因为该偏移量可以使用8位有符号的数字来表示。如果相对于结构体或类的开头的偏移量是128字节或更多,那么偏移量必须表示为一个32位数字(指令集在8位到32位之间没有偏移量)。例如:
struct S {
int a[100]; // 400
int b; // 4
int read() { return b; }
};
b成员的偏移量是400。任何通过指针或成员函数访问b字段的代码都需要将偏移量编码为32位数字。如果交换a和b,则两者都可以通过编码为8位有符号数字的偏移量来访问,或者根本不需要偏移量。
这会使代码更紧凑,方便更有效地使用代码缓存。因此,建议在结构或类声明中,大数组和其他大对象排在最后,最常用的数据成员排在前面。如果不能在前128个字节内包含所有数据成员,则将最常用的成员放在前128个字节中。
通过上面两个小知识点可以使得将结构体设计的更小,访问数据成员的速度更快,但是这有时往往会牺牲一些可读性,比如这种结构体:
struct S {
int deskA;
double deskB;
bool deskC;
int chairA;
double chairB;
bool chairC;
};
可能这样修改后结构体会更小:
struct S {
int deskA;
int chairA;
double deskB;
double chairB;
bool deskC;
bool chairC;
};
但是我们一般情况下貌似希望同类的字段放在一起,这样代码可读性更高一些,易于读懂代码。至于这种结构体具体需不需要重新排序,那就需要大家自己权衡啦。
小总结:
- 注意内存对齐;
- 128是个槛,常用的数据成员可考虑放在前128字节中,不常用的或大的数据成员可考虑放在后面(好久之前看的某个国外的博客学习到的,但是具体出处找不到了);
- 注重性能优化的同时也需要权衡一下代码的可读性。
打完收工。
网友评论