union与struct 的 sizeof 问题

考虑下面问题：（默认对齐方式）

union u
{
double a;
int b;
};

union u2
{
char a[13];
int b;
};

union u3
{
char a[13];
char b;
};

cout<<sizeof(u)<<endl; // 8
cout<<sizeof(u2)<<endl; // 16
cout<<sizeof(u3)<<endl; // 13

  都知道 union 的大小取决于它所有的成员中，占用空间最大的一个成员的大小。所以对于 u 来说，大小就是最大的 double 类型成员 a 了，所以 sizeof(u)=sizeof(double)=8 。但是对于 u2 和 u3 ，最大的空间都是char[13] 类型的数组，为什么 u3 的大小是 13 ，而 u2 是 16 呢？关键在于 u2 中的成员 int b 。由于 int 类型成员的存在，使 u2 的对齐方式变成 4 ，也就是说， u2 的大小必须在 4 的对界上，所以占用的空间变成了 16（最接近 13 的对界）。

  结论：复合数据类型，如 union ， struct ， class 的对齐方式为成员中对齐方式最大的成员的对齐方式。

  顺便提一下 CPU 对界问题， 32 的 C++ 采用 8 位对界来提高运行速度，所以编译器会尽量把数据放在它的对界上以提高内存命中率。对界是可以更改的，使用 #pragma pack(x) 宏可以改变编译器的对界方式，默认是 8 。C++ 固有类型的对界取编译器对界方式与自身大小中较小的一个。例如，指定编译器按 2 对界， int 类型的大小是 4 ，则 int 的对界为 2 和 4 中较小的 2 。在默认的对界方式下，因为几乎所有的数据类型都不大于默认的对界方式 8 （除了 long double ），所以所有的固有类型的对界方式可以认为就是类型自身的大小。更改一下上面的程序：

#pragma pack(2)
union u2
{
char a[13];
int b;
};

union u3
{
char a[13];
char b;
};
#pragma pack(8)

cout<<sizeof(u2)<<endl; // 14
cout<<sizeof(u3)<<endl; // 13

  由于手动更改对界方式为 2 ，所以 int 的对界也变成了 2 ， u2 的对界取成员中最大的对界，也是 2 了，所以此时 sizeof(u2)=14 。

  结论： C++ 固有类型的对界取编译器对界方式与自身大小中较小的一个。

因为对齐问题使结构体的 sizeof 变得比较复杂，看下面的例子： ( 默认对齐方式下 )

struct s1
{
char a;
double b;
int c;
char d;
};

struct s2
{
char a;
char b;
int c;
double d;
};

cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 16

  同样是两个 char 类型，一个 int 类型，一个 double 类型，但是因为对界问题，导致他们的大小不同。计算结构体大小可以采用元素摆放法，我举例子说明一下：首先， CPU 判断结构体的对界，根据上一节的结论， s1 和 s2的对界都取最大的元素类型，也就是 double 类型的对界 8 。然后开始摆放每个元素。
  对于 s1 ，首先把 a 放到 8 的对界，假定是 0 ，此时下一个空闲的地址是 1 ，但是下一个元素 d 是 double 类型，要放到 8 的对界上，离 1 最接近的地址是 8 了，所以 d 被放在了 8 ，此时下一个空闲地址变成了 16 ，下一个元素 c 的对界是 4 ， 16 可以满足，所以 c 放在了 16 ，此时下一个空闲地址变成了 20 ，下一个元素 d 需要对界 1 ，也正好落在对界上，所以 d 放在了 20 ，结构体在地址 21 处结束。由于 s1 的大小需要是 8 的倍数，所以 21-23 的空间被保留， s1 的大小变成了 24 。
  对于 s2 ，首先把 a 放到 8 的对界，假定是 0 ，此时下一个空闲地址是 1 ，下一个元素的对界也是 1 ，所以 b 摆放在 1 ，下一个空闲地址变成了 2 ；下一个元素 c 的对界是 4 ，所以取离 2 最近的地址 4 摆放 c ，下一个空闲地址变成了 8 ，下一个元素 d 的对界是 8 ，所以 d 摆放在 8 ，所有元素摆放完毕，结构体在 15 处结束，占用总空间为 16 ，正好是 8 的倍数。

  这里有个陷阱，对于结构体中的结构体成员，不要认为它的对齐方式就是他的大小，看下面的例子：

struct s1
{
char a[8];
};

struct s2
{
double d;
};

struct s3
{
s1 s;
char a;
};

struct s4
{
s2 s;
char a;
};

cout<<sizeof(s1)<<endl; // 8
cout<<sizeof(s2)<<endl; // 8
cout<<sizeof(s3)<<endl; // 9
cout<<sizeof(s4)<<endl; // 16;

s1 和 s2 大小虽然都是 8 ，但是 s1 的对齐方式是 1 ， s2 是 8 （ double ），所以在 s3 和 s4 中才有这样的差异。

  所以，在自己定义结构体的时候，如果空间紧张的话，最好考虑对齐因素来排列结构体里的元素

不要让 double 干扰你的位域

在结构体和类中，可以使用位域来规定某个成员所能占用的空间，所以使用位域能在一定程度上节省结构体占用的空间。不过考虑下面的代码：

struct s1
{
int i: 8;
int j: 4;
double b;
int a:3;
};

struct s2
{
int i;
int j;
double b;
int a;
};

struct s3
{
int i;
int j;
int a;
double b;
};

struct s4
{
int i: 8;
int j: 4;
int a:3;
double b;
};

cout<<sizeof(s1)<<endl; // 24
cout<<sizeof(s2)<<endl; // 24
cout<<sizeof(s3)<<endl; // 24
cout<<sizeof(s4)<<endl; // 16

可以看到，有 double 存在会干涉到位域（ sizeof 的算法参考上一节），所以使用位域的的时候，最好把 float 类型和 double 类型放在程序的开始或者最后。

posted @ 2012-03-20 16:42 Piosa 阅读(729) 评论(0) 收藏举报

Piosa

union与struct 的 sizeof 问题

公告