【linux编程】字节序

字节序

与同一台计算机上的进程进行通信时，一般不用考虑字节序，字节序是一个处理器架构特性，用于指示像整数计算的大数据类型内部的字节如何排序。

假设上图图中在内存 0x1000 到 0x1003 这连续的 4 个字节保存了数据，这段数据对应的数据类型是 int 类型。我们知道 int 类型的数据在大多数编译器实现中都是 4 字节。
那么上图这个 int 类型数据，到底是 0x10203040 还是 0x40302010？实际上这是依赖于处理器架构的。
对于 little-endian （小端）机器来说，这 4 字节数据被解释成 int 类型的话它就是 0x10203040，对于 big-endian （大端）机器来说，它被解释成 0x40302010.

按照这个规则，对于小端机器来说，高地址 0x1003 这个位置保存的是数据最高位，0x1000 这个地址保存的是数据的最低位，所以最终的 int 类型数据就是 0x10203040.

数据在内存中的存放方式似乎和我们想象的顺序不太一样，在我们的常规认知不一样，在我们的常规认知中，它的存放方式应该是00 00 00 01，那造成这个的原因是什么呢？

因为C语言在内存中存放数据时采用了两种存储模式，大端存储和小端存储。

在小端存储模式中最低位字节中存放的为01，大端存储模式中放的为00，于是我们可以想到通过强制转换的方法，将一个四个字节的整型数据截断为一个字节的字符型数据，即可得到这个低位的数据，再进行判断，如果为1则说明该机器为小端存储模式，如果为0则说明为大端存储模式

int main()
{
	int i = 1;
	char ch = (char)i;
	if (ch == 0)
		printf("大端存储\n");
	else if (ch == 1)
		printf("小端存储\n");
	return 0;
}

注意：大部分情况下，我们的使用都是小端机器，Intel 处理器和 AMD 处理器基本上都是小端的。但是也有一些处理器是大端的。TCP协议栈使用大端字节序(网络字节序)。

对于TCP/IP应用程序，有4个用来在处理字节序和网络字节序之间实施转换的函数。

#include <arpa/inet.h>
uint32_t htonl(uint32_t hostlong); // 返回值：以网络字节序表示的32位整数
uint16_t htons(uint16_t hostshort); // 返回值：以网路字节序表表示16位整数
uint32_t ntohl(uint32_t netlong);  // 返回值：以主机字节序表示的32位整数
uint16_t ntohs(uint16_t netshort); //返回值：以主机字节序表示16位整数

例1：

 1 #include <stdio.h>
 2 #include <arpa/inet.h>
 3 
 4 union Int
 5 {
 6     char data[4];
 7     int x;
 8 };
 9 
10 int main()
11 {
12     int i;
13     union Int a;
14     union Int b;
15     a.x = 0x10203040;
16     b.x = htonl(a.x);
17 
18     printf("a = 0x%08x\n", a.x);
19     for (i = 0; i < 4; ++i)
20     {
21         printf("[%p]: %02x\n", a.data + i, a.data[i]);
22     }
23     puts("");
24 
25     printf("b = 0x%08x\n", b.x);
26     for (i = 0; i < 4; ++i)
27     {
28         printf("[%p]: %02x\n", b.data + i, b.data[i]);
29     }
30     return 0;
31 }

输出：

参考资料

1. 128-字节序【Allen】

posted @ 2022-01-15 14:53 苏格拉底的落泪阅读(216) 评论(0) 收藏举报

刷新页面返回顶部

苏格拉底的落泪

用博客留下自己的一些脚印，记录自己曾经成长的故事。

【linux编程】字节序

字节序

参考资料

公告