美文网首页C语言程序员
C语言编程学习之意向不到的内存对齐问题

C语言编程学习之意向不到的内存对齐问题

作者: 小辰带你看世界 | 来源:发表于2018-05-14 22:44 被阅读18次

C语言是面向过程的,而C++是面向对象的

C和C++的区别:

C是一个结构化语言,它的重点在于算法和数据结构。C程序的设计首要考虑的是如何通过一个过程,对输入(或环境条件)进行运算处理得到输出(或实现过程(事务)控制)。

C++,首要考虑的是如何构造一个对象模型,让这个模型能够契合与之对应的问题域,这样就可以通过获取对象的状态信息得到输出或实现过程(事务)控制。 所以C与C++的最大区别在于它们的用于解决问题的思想方法不一样。之所以说C++比C更先进,是因为“ 设计这个概念已经被融入到C++之中 ”。

C与C++的最大区别:在于它们的用于解决问题的思想方法不一样。之所以说C++比C更先进,是因为“ 设计这个概念已经被融入到C++之中 ”,而就语言本身而言,在C中更多的是算法的概念。那么是不是C就不重要了,错!算法是程序设计的基础,好的设计如果没有好的算法,一样不行。而且,“C加上好的设计”也能写出非常好的东西。

什么是内存对齐?看下面的结构体

小编推荐一个学C语言/C++的学习裙【 六九九,四七零,五九六 】,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

struct StudentTest{

char ch1;

short s;

char ch2;

int i;

};

假设这个结构的成员在内存中是紧凑排列的,

假设ch1的地址是0x00000000,那么s的地址就应该是0x00000001

ch2的地址应该0x00000003,i的地址应该是0x00000004

实际情况如何,写一个小程序来测试下:

struct StudentTest{

char ch1;

short s;

char ch2;

int i;

};

int main(void)

{

struct StudentTest a;

printf("ch1 %p,s %p,ch2 %p,i %p ",

(unsigned int)(void*)&a.ch1-(unsigned int)(void*)&a,

(unsigned int)(void*)&a.s-(unsigned int)(void*)&a,

(unsigned int)(void*)&a.ch2-(unsigned int)(void*)&a,

(unsigned int)(void*)&a.i-(unsigned int)(void*)&a

);

return 0;

}

实际输出如下:

小编推荐一个学C语言/C++的学习裙【 六九九,四七零,五九六 】,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

这就是内存对齐导致的问题。

为什么会有内存对齐?

字、双字和四字在自然边界上方是不需要对齐的,(对于字,双字和四字来说自然边界分别是偶数地址,能被4整除的地址和能被8整除的地址)。为了提高程序的性能,数据结构(尤其是栈)应该尽可能的在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要做两次内存访问。而对齐的内存只需做一次内存访问。 一个字或双字操作数跨越了4 字节边界,或者一个四字操作数跨越了8 字节边界,被认为是未对齐的,从而需要两次总线周期来访问内存。一个字起始地址是奇数但却没有跨越字边界被认为是对齐的,能够在一个总线周期中被访问。某些操作双四字的指令需要内存操作数在自然边界上对齐。如果操作数没有对齐,这些指令将会产生一个通用保护异常。双四字的自然边界是能够被16 整除的地址。其他的操作双四字的指令允许未对齐的访问(不会产生通用保护异常),然而,需要额外的内存总线周期来访问内存中未对齐的数据。

缺省情况下,编译器默认将结构、栈中的成员数据进行内存对齐。因此,上面的程序输出就变成了:

c1 00000000, s 00000002, c2 00000004, i 00000008。

编译器将未对齐的成员向后移,将每一个都成员对齐到自然边界上,从而也导致了整个结构的尺寸变大。尽管会牺牲一点空间(成员之间有部分内存空闲),但提高了性能。也正是这个原因,我们不可以断言sizeof(TestStruct1)的结果为8。在这个例子中,sizeof(TestStruct1)的结果为12。

如何避免内存对齐影响?

那么,能不能既达到提高性能的目的,又能节约一点空间呢?有一点小技巧可以使用。比如我们可以将上面的结构改成:

struct StudentTest2

{

char c1;

char c2;

short s;

int i;

};

这样一来,每个成员都对齐在其自然边界上,从而避免了编译器自动对齐。在这个例子中,sizeof(StudentTest2)的值为8。这个技巧有一个重要的作用,尤其是这个结构作为API的一部分提供给第三方开发使用的时候。第三方开发者可能将编译器的默认对齐选项改变,从而造成这个结构在你的发行的DLL 中使用某种对齐方式,而在第三方开发者哪里却使用另外一种对齐方式。这将会导致重大问题。比如,StudentTest结构,我们的DLL 使用默认对齐选项,对齐为c1 00000000, s 00000002, c2 00000004, i 00000008,同时sizeof(StudentTest)的值为12。

而第三方将对齐选项关闭,导致

c1 00000000, s 00000001, c2 00000003, i 00000004,同时sizeof(StudentTest)的值为8。

除此之外我们还可以利用#pragma pack()来改变编译器的默认对齐方式。

使用指令#pragma pack (n),编译器将按照n 个字节对齐。

使用指令#pragma pack (),编译器将取消自定义字节对齐方式。

在#pragma pack (n)和#pragma pack ()之间的代码按n 个字节对齐。

但是,成员对齐有一个重要的条件,即每个成员按自己的方式对齐.也就是说虽然指定了按n 字节对齐,但并不是所有的成员都是以n 字节对齐。其对齐的规则是,每个成员按其类型的对齐参数(通常是这个类型的大小)和指定对齐参数(这里是n 字节)中较小的一个对齐,即:

min( n, sizeof( item )) 。并且结构的长度必须为所用过的所有对齐参数的整数倍,不够就补空字节。看如下例子:

#pragma pack(8)

struct TestStruct4{

char a;

long b;

};

struct TestStruct5{

char c;

TestStruct4 d;

long long e;

};

#pragma pack()

A),sizeof(TestStruct4) = ?

B), TestStruct5 的c 后面空了几个字节接着是d?

TestStruct4 中,成员a 是1 字节默认按1 字节对齐,指定对齐参数为8,这两个值中取1,a按1 字节对齐;成员b 是4 个字节,默认是按4 字节对齐,这时就按4 字节对齐,所以sizeof(TestStruct4)应该为8;

TestStruct5 中,c 和TestStruct4 中的a 一样,按1 字节对齐,而d 是个结构,它是8 个字节,它按什么对齐呢?对于结构来说,它的默认对齐方式就是它的所有成员使用的对齐参数中最大的一个, TestStruct4 的就是4.所以,成员d 就是按4 字节对齐.成员e 是8 个字节,它是默认按8字节对齐,和指定的一样,所以它对到8 字节的边界上,这时,已经使用了12 个字节了,所以又添

加了4 个字节的空,从第16 个字节开始放置成员e.这时,长度为24,已经可以被8(成员e 按8字节对齐)整除.这样,一共使用了24 个字节.内存布局如下(*表示空闲内存,1 表示使用内存。单位为1byte):

a b

TestStruct4 的内存布局:1***, 1111,

c TestStruct4.a TestStruct4.b d

TestStruct5 的内存布局: 1***, 1***, 1111, ****, 11111111

这里有三点很重要:

首先,每个成员分别按自己的方式对齐,并能最小化长度。

其次,复杂类型(如结构)的默认对齐方式是它最长的成员的对齐方式,这样在成员是复杂类型时,可以最小化长度。然后,对齐后的长度必须是成员中最大的对齐参数的整数倍,这样在处理数组时可以保证每一项都边界对齐。

补充一下,对于数组,比如:char a[3];它的对齐方式和分别写3 个char 是一样的.也就是说

它还是按1 个字节对齐.如果写: typedef char Array3[3];Array3 这种类型的对齐方式还是按1个字节对齐,而不是按它的长度。但是不论类型是什么,对齐的边界一定是1,2,4,8,16,32,64....中的一个。

另外,注意别的#pragma pack 的其他用法:

#pragma pack(push) //保存当前对其方式到packing stack

#pragma pack(push,n) 等效于

#pragma pack(push)

#pragma pack(n) //n=1,2,4,8,16 保存当前对齐方式,设置按n 字节对齐。

#pragma pack(pop) //packing stack 出栈,并将对其方式设置为出栈的对齐

小编推荐一个学C语言/C++的学习裙【 六九九,四七零,五九六 】,无论你是大牛还是小白,是想转行还是想入行都可以来了解一起进步一起学习!裙内有开发工具,很多干货和技术资料分享!

这些是C/C++能做的

服务器开发工程师、人工智能、云计算工程师、信息安全(黑客反黑客)、大数据 、数据平台、嵌入式工程师、流媒体服务器、数据控解、图像处理、音频视频开发工程师、游戏服务器、分布式系统、游戏辅助等

相关文章

  • C语言编程学习之意向不到的内存对齐问题

    C语言是面向过程的,而C++是面向对象的 C和C++的区别: C是一个结构化语言,它的重点在于算法和数据结构。C程...

  • sizeof与字节对齐

    参考 【面试题】sizeof引发的血案编译器与字节对齐c 语言字节对齐问题详解C/C++内存对齐内存存取粒度C和C...

  • 解析C语言结构体对齐(内存对齐问题)

    解析C语言结构体对齐(内存对齐问题) C语言结构体对齐也是老生常谈的话题了。基本上是面试题的必考题。内容虽然很基础...

  • 内存对齐

    在C语言柔性数组一文中,提到了内存对齐,于是想写篇文章总结总结内存对齐。 内存对齐 为什么需要内存对齐 计算机系统...

  • C语言 内存对齐

    引言 先看一个例子: 请问Test_T占几个字节?如果你的回复是 1 + 4 = 5,那就错了。我们看下程序运行的...

  • C面试-内存对齐

    参考: 【嵌入式时代】C语言面试题详解(第7节),不知道“内存对齐”的程序员是不合格的 转载自:C语言的内存对齐 ...

  • 结构体内存对齐

    前言 OC语言底层是基于c和c++的,而NSObject在底层也是用结构体实现的,所以了解了结构体的内存对齐问题对...

  • C语言中内存对其规则

    C语言中结构体内存对齐规则 对齐规则: 内存偏移为该数据类型的最小整数倍 总体占用内存为结构体中最大数据类型的整数...

  • 技术领导力

    吃透基础技术 编程 C 直接和内存地址打交道,C语言设计第二版,内存管理,网络 了解汇编语言 编程范式算法 数据库...

  • sizeof(struct)

    在C语言中,结构体会以占用字节最长的变量为基准,做内存对齐。

网友评论

    本文标题:C语言编程学习之意向不到的内存对齐问题

    本文链接:https://www.haomeiwen.com/subject/opjsdftx.html