ncnn中内存对齐
在ncnn源码net.cpp中,int Net::load_param(const unsigned char* _mem)函数中你可以看到这么一段代码:
if ((unsigned long)_mem & 0x3)
{
// reject unaligned memory
fprintf(stderr, "memory not 32-bit aligned at %p\n", _mem);
return -1;
}
将指针地址和0x3进行位与,目的其实是判断指针地址是不是4字节对齐的,主要的原因是不对齐,cpu读取的效率会变低,具体举例就是本来只需要一次读取的可能需要两次读取了。
什么是内存对齐
cpu在读取内存时是一块一块进行读取的,块的大小可以是2,4,8,16(总之是2的倍数)。举例来说:如果一个变量int 的起始地址偏移是1,那么CPU要取这个地址上的数据,需要取两次。如图,cpu按四字节读取,第一次读取0x0 ~ 0x3,

cpu第二次读取0x4 ~ 0x7,这时cpu才能读到这个int的值。

如果内存对齐了呢,就如下只需一次读取:

typedef struct {
int a; //4字节
double b; //8字节
short c; //2字节
}A;
typedef struct {
int a; //4字节
short b; //2字节
double c; //8字节
}B;
上面两个结构体,理论上来说它们是一样大小的,但是当我们sizeof(A)=24,sizeof(B)=16。分析一下:对结构体A来说,a占4个字节,占从0 ~ 3的字节,b是double类型占8个字节,占从8 ~ 15的字节,c占两个字节,从16 ~ 17的字节。 对结构体B来说,a占4个字节,从0 ~ 3,b占两个字节从4 ~ 6;c占8个字节从8 ~ 15。当然上面的分析是针对gcc编译器的,不同的编译器有不同的对齐规则。
内存对齐规则
1、 对于结构的各个成员,第一个成员位于偏移为0的位置,以后每个数据成员的偏移量必须是min(#pragma pack()指定的数,这个数据成员的自身长度) 的倍数。
2、 在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。
3、 必须是2的整数倍
网友评论