24.位域-
- 1.概念
C 语言的位域(bit-field)是一种特殊的结构体成员,允许我们按位对成员进行定义,指定其占用的位数。
位域允许我们将多个变量打包到一个整数内存单元中,通过指定变量占用的位数来节省空间。
如果程序的结构中包含多个开关的变量,即变量值为 TRUE/FALSE,如下:
struct
{
unsigned int widthValiedated;
unsigned int heightValidated;
} status;
这种结构需要 8 字节的内存空间,但在实际上,在每个变量中,我们只存储 0 或 1,在这种情况下,C 语言提供了一种更好的利用内存空间的方式。如果您在结构内使用这样的变量,您可以定义变量的宽度来告诉编译器,您将只使用这些字节。例如,上面的结构可以重写成:
struct
{
unsigned int widthValiedated : 1;
unsigned int heightValidated : 1;
} status;
上述代码解析:
- 理论存储需求
widthValidated:1位(0或1) ,表示的是这个值的二进制所占的位数
heightValidated:1位(0或1)
理论上只需要 2位(不足1字节)
- 实际内存占用(4字节)的原因
内存对齐规则:C标准规定位域的底层存储单元是某种整数类型(如unsigned int)
最小分配单位:即使你只用了2位,编译器仍然会分配一个完整的unsigned int单元(通常是4字节)
不可分割性:位域不能跨存储单元分配
- 内存布局示例
[整个unsigned int(4字节/32位)]
| 31...2 | 1 | 0 |
| 未使用 | heightValid | widthValid |
上面的结构中,status 变量将占用 4 个字节(32位)的内存空间,但是只有 2 位被用来存储值。如果您用了 32 个变量,每一个变量宽度为 1 位,那么 status 结构将使用 4 个字节,但只要您再多用一个变量,如果使用了 33 个变量,那么它将分配内存的下一段来存储第 33 个变量,这个时候就开始使用 8 个字节。让我们看看下面的实例来理解这个概念:
#include <stdio.h>
#include <string.h>
/*定义简单结构*/
struct
{
unsigned int widthValidated;
unsigned int heightValidated;
} status1;
/*定义位域结构*/
struct
{
unsigned int widthValidated : 1;
unsigned int heightValidated : 1;
} status2;
int main()
{
printf("status1 占用的内存大小为:%d\n", sizeof(status1));
printf("status2 占用的内存大小为:%d\n", sizeof(status2));
return 0;
}
//输出
8
4
-
位域的特点和使用方法如下:
- 定义位域时,可以指定成员的位域宽度,即成员所占用的位数。
- 位域的宽度不能超过其数据类型的大小,因为位域必须适应所使用的整数类型。
- 位域的数据类型可以是 int、unsigned int、signed int 等整数类型,也可以是枚举类型。
- 位域可以单独使用,也可以与其他成员一起组成结构体。
- 位域的访问是通过点运算符(.)来实现的,与普通的结构体成员访问方式相同。
-
2.位域声明
有些信息在存储时,并不需要占用一个完整的字节,而只需占几个或一个二进制位。例如在存放一个开关量时,只有 0 和 1 两种状态,用 1 位二进位即可。为了节省存储空间,并使处理简便,C 语言又提供了一种数据结构,称为"位域"或"位段"。
所谓"位域"是把一个字节中的二进位划分为几个不同的区域,并说明每个区域的位数。每个域有一个域名,允许在程序中按域名进行操作。这样就可以把几个不同的对象用一个字节的二进制位域来表示。
如:
[整个unsigned int(4字节/32位)]
| 31...2 | 1 | 0 |
| 未使用 | heightValid | widthValid |
-
典型的实例:
- 用 1 位二进位存放一个开关量时,只有 0 和 1 两种状态。
- 读取外部文件格式——可以读取非标准的文件格式。例如:9 位的整数。
-
3.位域的定义和位域变量的说明
位域定义与结构定义相仿,其形式为:
struct 位域结构名
{
位域列表
};
其中位域列表的形式为:type [member_name] : width ;
下面是有关位域中变量元素的描述:
元素 | 描述 |
---|---|
type | 只能为 int(整型),unsigned int(无符号整型),signed int(有符号整型) 三种类型,决定了如何解释位域的值。 |
member_name | 位域的名称。 |
width | 位域中位的数量。宽度必须小于或等于指定类型的位宽度。 |
案例
#include <stdio.h>
struct packed_struce {
unsigned int f1 : 1; //1位的位域
unsigned int f2 : 1; //1位的位域
unsigned int f3 : 1; //1位的位域
unsigned int f4 : 1; //1位的位域
unsigned int type : 4; //4位的位域
unsigned int my_int : 9; //9位的位域
};
int main(){
struct packed_struct pack;
//赋值
pack.f1 = 1;
pack.f2 = 0;
pack.f3 = 1;
pack.f4 = 0;
pack.type = 7;
pack.my_int = 255;
printf("f1: %u\n", pack.f1);
printf("f2: %u\n", pack.f2);
printf("f3: %u\n", pack.f3);
printf("f4: %u\n", pack.f4);
printf("type: %u\n", pack.type);
printf("my_int: %u\n", pack.my_int);
return 0;
}
//输出
f1: 1
f2: 0
f3: 1
f4: 0
type: 7
my_int: 255
- 刨析案例
#include <stdio.h>
#include <string.h>
struct {
unsigned int age : 3; // 3位位域,可表示0~7
} Age;
int main( )
{
Age.age = 4;
printf( "Sizeof( Age ) : %d\n", sizeof(Age) );
printf( "Age.age : %d\n", Age.age );
Age.age = 7;
printf( "Age.age : %d\n", Age.age );
Age.age = 8; // 二进制表示为 1000 有四位,超出
printf( "Age.age : %d\n", Age.age );
return 0;
}
//输出
Sizeof( Age ) : 4
Age.age : 4
Age.age : 7
Age.age : 0
关键点:
-
age : 3 表示这个成员只占用3个二进制位
-
3位无符号整数的取值范围是 0~7(2^3 - 1)
-
当你尝试 Age.age = 8 时:
- 8的二进制是 1000(需要4位表示)
- 超出3位的存储能力
-
具体执行过程
代码 说明 输出结果
Age.age = 4 4的二进制是 100(3位内)正常存储 Age.age : 4
Age.age = 7 7的二进制是 111(刚好3位)正常存储 Age.age : 7
Age.age = 8 8需要 1000(4位)超出3位限制发生截断 Age.age : 0(异常)
-
为什么输出0
-
当赋值超出位域范围时:
- 编译器会截断高位,只保留低位
- 对于 8(二进制 1000):
- 取最后3位 000
- 结果是 0
-
计算字节数:
#include <stdio.h>
struct example1 {
int a : 4;
int b : 5;
int c : 7;
};
int main() {
struct example1 ex1;
printf("Size of example1: %lu bytes\n", sizeof(ex1));
return 0;
}
//输出
Size of example1: 4 bytes
- 对于位域的定义尚有以下几点说明:
一个位域存储在同一个字节中,如一个字节所剩空间不够存放另一位域时,则会从下一单元起存放该位域。也可以有意使某位域从下一单元开始。例如:
struct bs{
unsigned a:4;
unsigned :4; /* 空域 */
unsigned b:4; /* 从下一单元开始存放 */
unsigned c:4
}
在这个位域定义中,a 占第一字节的 4 位,后 4 位填 0 表示不使用,b 从第二字节开始,占用 4 位,c 占用 4 位。
位域的宽度不能超过它所依附的数据类型的长度,成员变量都是有类型的,这个类型限制了成员变量的最大长度,: 后面的数字不能超过这个长度。
位域可以是无名位域,这时它只用来作填充或调整位置。无名的位域是不能使用的。例如:
struct k{
int a:1;
int :2; /* 该 2 位不能使用 */
int b:3;
int c:2;
};
从以上分析可以看出,位域在本质上就是一种结构类型,不过其成员是按二进位分配的。
- 位域的使用
位域的使用和结构成员的使用相同,其一般形式为:
位域变量名.位域名
位域变量名->位域名
位域允许用各种格式输出。
请看下面的实例:
#include <stdio.h>
int main(){
struct bs{
unsigned a:1;
unsigned b:3;
unsigned c:4;
} bit,*pbit;
bit.a=1; /* 给位域赋值(应注意赋值不能超过该位域的允许范围) */
bit.b=7; /* 给位域赋值(应注意赋值不能超过该位域的允许范围) */
bit.c=15; /* 给位域赋值(应注意赋值不能超过该位域的允许范围) */
printf("%d,%d,%d\n",bit.a,bit.b,bit.c); /* 以整型量格式输出三个域的内容 */
pbit=&bit; /* 把位域变量 bit 的地址送给指针变量 pbit */
pbit->a=0; /* 用指针方式给位域 a 重新赋值,赋为 0 */
pbit->b&=3; /* 使用了复合的位运算符 "&=",相当于:pbit->b=pbit->b&3,位域 b 中原有值为 7,与 3 作按位与运算的结果为 3(111&011=011,十进制值为 3) */
pbit->c|=1; /* 使用了复合位运算符"|=",相当于:pbit->c=pbit->c|1,其结果为 15 */
printf("%d,%d,%d\n",pbit->a,pbit->b,pbit->c); /* 用指针方式输出了这三个域的值 */
}