C语言、C++内存对齐问题详解

作者：果冻想字体：[增加减小] 来源：互联网时间：2017-05-28

果冻想通过本文主要向大家介绍了c++编程实例详解,c++编程实例详解pdf,c++ 虚函数详解,c++指针详解,c++关键字详解等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

这也可以？

#include <iostream>
using namespace std;

struct Test_A
{
     char a;
     char b;
     int c;
};

struct Test_B
{
     char a;
     int c;
     char b;
};

struct Test_C
{
     int c;
     char a;
     char b;
};

int main()
{
     struct Test_A a;
     memset(&a, 0, sizeof(a));

     struct Test_B b;
     memset(&b, 0, sizeof(b));

     struct Test_C c;
     memset(&c, 0, sizeof(c));

     // Print the memory size of the struct
     cout<<sizeof(a)<<endl;
     cout<<sizeof(b)<<endl;
     cout<<sizeof(c)<<endl;

     return 0;
}
</div>

好了，一段简单的程序，上面的这段程序输出是什么？如果你很懂，也就会知道我接下来要讲什么了，可以略过了；如果，你不知道，或者还很模糊，请继续阅读。

这是为什么？

上面这段程序的输出结果如下（windows 8.1 + visual studio 2012 update3下运行）:
// Print the memory size of the struct
cout<< sizeof(a)<<endl; // 8bytes
cout<< sizeof(b)<<endl; // 12bytes
cout<< sizeof(c)<<endl; // 8bytes
</div>

很奇怪么？定义的三个结构体，只是换了一下结构体中定义的成员的先后顺序，怎么最终得到的结构体所占用的内存大小却不一样呢？很诡异么？好了，这就是我这里要总结的内存对齐概念了。

内存对齐

内存对齐的问题主要存在于理解struct和union等复合结构在内存中的分布。许多实际的计算机系统对基本类型数据在内存中存放的位置有限制，它们会要求这些数据的首地址的值是某个数k（通常它为4或8）的倍数，这就是所谓的内存对齐。这个值k在不同的CPU平台下，不同的编译器下表现也有所不同，现在我们涉及的主流的编译器是Microsoft的编译器和GCC。

对于我们这种做上层应用的程序员来说，真的是很少考虑内存对齐这个问题的，内存对齐对于上层程序员来说，是“透明的”。内存对齐，可以说是编译器做的工作，编译器为程序中的每个数据块安排在适当的内存位置上。很多时候，我们要写出效率更高的代码，此时我们就需要去了解这种内存对齐的概念，以及编译器在后面到底偷偷摸摸干了点什么。特别是对于C和C++程序员来说，理解和掌握内存对齐更是重要的。

为什么要有内存对齐呢？该占用多大的内存，那就开辟对应大小的内存就好了，好比上面的结构体，两个char类型和一个int类型，大小应该是6bytes才对啊，怎么又是8bytes，又是12bytes的啊？对于内存对齐，主要是为了提高程序的性能，数据结构，特别是栈，应该尽可能地在自然边界上对齐。原因在于，为了访问未对其的内存，处理器需要做两次内存访问；然而，对齐的内存访问仅仅需要一次内存访问。

在计算机中，字、双字和四字在自然边界上不需要在内存中对齐（对字、双字和四字来说，自然边界分别是偶数地址，可以被4整除的地址和可以被8整除的地址）。如果一个字或双字操作数跨越了4字节边界，或者一个四字操作数跨越了8字节边界，就被认为是未对齐的，从而需要两次总线周期来访问内存。一个字起始地址是奇数，但却没有跨越字边界，就被认为是对齐的，能够在一个总线周期中被访问。综上所述，内存对齐可以用一句话来概括——数据项只能存储在地址是数据项大小的整数倍的内存位置上。

我们再来看看一个简答的例子：
#include <stdio.h>

struct Test
{
     char a;
     int b;
     int c;
     char d;
};

int main()
{
     struct Test structTest;
     printf("&a=%p\n", &structTest.a);
     printf("&b=%p\n", &structTest.b);
     printf("&c=%p\n", &structTest.c);
     printf("&d=%p\n", &structTest.d);

     printf("sizeof(Test)=%d\n", sizeof(structTest));
     return 0;
}
</div>

输出结果如下：
&a=00C7FA44
&b=00C7FA48
&c=00C7FA4C
&d=00C7FA50
sizeof(Test)=16
</div>

结构体Test的成员变量b占用字节数为4bytes，所以只能存储在4的整数倍的位置上，由于a只占用1一个字节，而a的地址00C7FA44和b的地址00C7FA48之间相差4bytes，这就说明，a其实也占用了4个字节，这样才能保证b的起始地址是4的整数倍。这就是内存对齐。如果没有内存对齐，我们再拿上面的代码作为例子，则可能输出结果如下：

&a=ffbff5e8
&b=ffbff5e9
&c=ffbff5ed
&d=ffbff5f1
sizeof(Test)=10
</div>

可以看到，a占用了一个字节，紧接着a之后就是b；之前也说了，内存对齐是操作系统为了快速访问内存而采用的一种策略，简单来说，就是为了防止变量的二次访问。操作系统在访问内存时，每次读取一定的长度（这个长度就是操作系统的默认对齐系数，或者是默认对齐系数的整数倍）。没有了内存对齐，当我们读取变量c时，第一次读取0xffbff5e8~0xffbff5ef的内存，第二次读取0xffbff5f0~0xffbff5f8的内存，由于变量c所占用的内存跨越了两片地址区域，为了正确得到变量c的值，就需要读取两次，将两次内存合并进行整合，这样就降低了内存的访问效率。

我在这里说了这么多，也挺绕口，这就是内存对齐的规则。在C++中，每个特定平台上的编译器都有自己的内存对齐规则，下面我们就内存对齐的规则进行总结。

内存对齐规则

每个特定平台上的编译器都有自己的默认“对齐系数”。我们可以通过预编译命令#pragma pack(k)，k=1,2,4,8,16来改变这个系数，其中k就是需要指定的“对齐系数”；也可以使用#pragma pack()取消自定义字节对齐方式。具体的对齐规则如下：

规则1：struct或者union的数据成员对齐规则：第一个数据成员放在offset为0的地方，对齐按照#pragma pack指定的数值和自身占用字节数中，二者比较小的那个进行对齐；比如；
#pragma pack(4) // 指定对齐系数为4，当占用字节数大于等于4时，就按照4进行对齐
struct Test
{
     char x1;
     short x2;
     float x3;
     char x4;
};
</div>

x1占用字节数为1，1 < 4，按照对齐系数1进行对齐，所以x1放置在offset为0的位置；
x2占用字节数为2，2 < 4，按照对齐系数2进行对齐，所以x2放置在offset为2，3的位置；
x3占用字节数为4，4 = 4，按照对齐系数4进行对齐，所以x3放置

分享到：QQ空间新浪微博腾讯微博微信百度贴吧 QQ好友复制网址打印

您可能想查找下面的文章:

2017-05-28c语言中单引号和双引号的区别(顺利解决从字符串中提取IP地址的困惑)
2017-05-28C语言关键字auto与register的深入理解
2017-05-28C语言的Struct Hack笔记
2017-05-28php调用c++的方法
2017-05-28C++ 面试题翻译电话号码实例代码
2017-05-28VC对自定义资源加密解密(AES)的详解
2018-08-06VS2010 C++程序调用C#库
2017-05-28解析C++中指向对象的指针使用
2017-05-28VC++时钟函数
2017-05-28插入排序的顺序表实现代码

C语言、C++内存对齐问题详解

您可能想查找下面的文章:

相关文章

文章分类

最近更新的内容