C语言字节对齐

对齐的概念:
    现代计算机中内存空间都是按照byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是 在访问特定类型变量的时候经常在特 定的内存地址访问,这就需要各种类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。

对齐的作用以及原因:
    各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存取。比如有些架构的CPU在访问 一个没有进行对齐的变量的时候会发生错误,那么在这种架构下编程必须保证字节对齐.其他平台可能没有这种情况,但是最常见的是如果不按照适合其平台要求对 数据存放进行对齐,会在存取效率上带来损失。比如有些平台每次读都是从偶地址开始,如果一个int型(假设为32位系统)如果存放在偶地址开始的地方,那 么一个读周期就可以读出这32bit,而如果存放在奇地址开始的地方,就需要2个读周期,并对两次读出的结果的高低字节进行拼凑才能得到该32bit数据。

CPU 的访问粒度不仅仅是大小限制,地址上也有限制。也就是说,CPU 只能访问对齐地址上的固定长度的数据。
以四字节对齐为例,就是只能访问 0x0 - 0x3,0x4 - 0x7, 0x8 - 0xc 这样的(闭)区间,不能跨区间访问。
如果真正需要访问的数据并没有占据那个区间的全部字节范围,还有另外的信号线来指出具体操作哪几个字节,类似于掩码的作用。好像也有些架构干脆就不允许这种部分访问,强制要求按粒度访问。
如果一个数据跨越了两个这样的区间,那么就只能将这个数据的操作拆分成两部分,分别执行,效率当然就低了。


对齐的实现
  通常,我们写程序的时候,不需要考虑对齐问题。编译器会替我们选择适合目标平台的对齐策略。当然,我们也可以通知给编译器传递预编译指令而改变对指定数据的对齐方法。
  但是,正因为我们一般不需要关心这个问题,所以因为编辑器对数据存放做了对齐,而我们不了解的话,常常会对一些问题感到迷惑。最常见的就是struct数据结构的sizeof结果,出乎意料。为此,我们需要对对齐算法所了解。


其实字节对齐的细节和具体编译器实现相关,但一般而言,满足三个准则:
  1) 首地址:结构体变量的首地址能够被其最宽基本类型成员的大小所整除
  2) 成员对齐:结构体每个成员相对于结构体首地址的偏移量都是该成员大小的整数倍,如有需要编译器会在成员之间加上填充字节
  3) 尾部填充:结构体的总大小为结构体最宽基本类型成员大小的整数倍,如有需要编译器会在最末一个成员之后加上填充字节
 

变量占多少个字节不仅和机器多少位有关,还和编译器有关。

32位机器上,在TC上int占2 字节,在VC中int占4字节

64位机器上,gcc编译器中int占4字节

#include <stdio.h>

struct A {
  int a;
  short b;
  char c;
};

struct B {
  char a;
  short b;
  int c;
};

struct C {
  short a;
  int b;
  char c;
};

#pragma pack (1) /* 指定字节对齐方式*/
struct D {
  short a;
  int b;
  char c;
};
#pragma pack () /*取消字节对齐, 恢复缺省对齐*/

int main()
{
    printf("sizeof(char) = %d\n", (int)sizeof(char));
    printf("sizeof(short) = %d\n", (int)sizeof(short));
    printf("sizeof(int) = %d\n", (int)sizeof(int));
    printf("sizeof(long) = %d\n", (int)sizeof(long));
    printf("sizeof(float) = %d\n", (int)sizeof(float));
    printf("sizeof(double) = %d\n", (int)sizeof(double));
    printf("\n");

    printf("sizeof(chari*) = %d\n", (int)sizeof(char*));
    printf("sizeof(int*) = %d\n", (int)sizeof(int *));
    printf("sizeof(long*) = %d\n", (int)sizeof(long *));
    printf("\n");

    printf("sizeof(struct A) = %d\n", (int)sizeof(struct A));
    printf("sizeof(struct B) = %d\n", (int)sizeof(struct B));
    printf("sizeof(struct C) = %d\n", (int)sizeof(struct C));
    printf("sizeof(struct D) = %d\n", (int)sizeof(struct D));
    printf("\n");

    struct C c1 = {1, 2, 3};
// 通常不这么使用
int *p; p = (int*)(&c1); p++; /*skip 4 bytes */ printf("c1.b=%d\n", *p); return 0; }

 

64位机器下测试

mutian@mutian:~/soft$ ./a.out
sizeof(char) = 1
sizeof(short) = 2
sizeof(int) = 4
sizeof(long) = 8
sizeof(float) = 4
sizeof(double) = 8

sizeof(chari*) = 8
sizeof(int*) = 8
sizeof(long*) = 8

sizeof(struct A) = 8
sizeof(struct B) = 8
sizeof(struct C) = 12
sizeof(struct D) = 7

c1.b=2

 

 

 

struct C {
  short a;
  int b;
  char c;
  short d;
  char e;
};

 

16

struct C {
  short a;
  int b;
  char c;
  char d;
  char e;
  char f;
};

12

 

 

 

posted @ 2015-12-16 17:34  牧 天  阅读(237)  评论(0)    收藏  举报