基本数据类型
最近在做串口通信,对一些基本的数据长度记得不太清楚了,特意查了一下,最后总结成下文以便日后查阅……
计算机的存储单位:
位 bit (比特)(Binary Digits):存放一位二进制数,即 0 或 1,最小的存储单位。
字节 byte:8个二进制位为一个字节(B),最常用的单位。
存储单位之间的关系:
1DWORD(双字) = 2WORD(字) = 4BYTE(字节) = 32BIT(“位”或“比特”)
1 KB = 1024 bytes
1 MB = 1024 KB = 1024*1024 bytes
1 GB = 1024 MB = 1024*1024*1024 bytes
1 TB = 1024 GB = 1024*1024*1024*1024 bytes
其中1024=2^10 ( 2 的10次方)
常见误区:
Mbps = mega bits per second(兆位/秒)是速率单位,2M带宽应该是2兆位/秒,即2MBps。
MB = mega bytes(兆比、兆字节)是量单位,1MB/S(兆字节/秒)= 8MBPS(兆位/秒)。
ANSI C/C++基本数据类型(均为小写):
| Type | Size | 数值范围 |
| 无值型void | 0 byte | 无值域 |
| 布尔型bool | 1 byte | true false |
| 有符号短整型short [int] /signed short [int] | 2 byte | -32768~32767 |
| 无符号短整型unsigned short [int] | 2 byte | 0~65535 |
| 有符号整型int /signed [int] | 4 byte | -2147483648~2147483647 |
| 无符号整型unsigned [int] | 4 byte | 0~4294967295 |
| 有符号长整型long [int]/signed long [int] | 4 byte | -2147483648~2147483647 |
| 无符号长整型unsigned long [int] | 4 byte | 0~4294967295 |
| long long | 8 byte | 0~18446744073709552000 |
| 有符号字符型char/signed char | 1 byte | -128~127 |
| 无符号字符型unsigned char | 1 byte | 0~255 |
| 宽字符型wchar_t (unsigned short.) | 2 byte | 0~65535 |
| 单精度浮点型float | 4 byte | -3.4E-38~3.4E+38 |
| 双精度浮点型double | 8 byte | 1.7E-308~1.7E+308 |
| long double | 8 byte | |
说明:
(1)类型修饰符signed和unsigned用于修饰字符型和整形。
(2)类型修饰符short和long用于修饰字符型和整形。
(3)当用signed和unsigned、short和long修饰int整形时,int可省略。
(4)其中bool和wchar_t是C++特有的。
(5)除上表以外,C/C++都可以自定义枚举enum、联合union和struct结构体类型。
(6)以上sizeof通过Windows XP 32位平台测试,其中某些类型数据的字节数和数值范围由操作系统和编译平台决定。比如16位机上,sizeof(int) = 2,而32位机上sizeof(int) = 4;32位机上sizeof(long) = 4,而64位机上sizeof(long) = 8。除此之外,注意64位机上的pointer占8byte。
(7)void的字面意思是“无类型”,不能用来定义变量。void真正发挥的作用在于:<1> 对函数返回和函数参数的限定,例如自定义既不带参数也无返回值的函数void MyFunc(void);<2>定义无类型通用指针void *,指向任何类型的数据。
(8)标准C++库及STL还提供了通用数据结构:字符串类string;向量类模板vector;双端队列类模板deque;链表类模板list;容器适配器堆栈类stack(实现先进后出的操作);容器适配器队列类queue(实现先进先出的操作);集合类set;多重集合类multiset;映射类map;多重映射类multimap;位集合bitset;迭代器iterator (类似指针的功能,对容器的内容进行访问)。
(9)在标准c++中,int的定义长度要依靠你的机器的字长,也就是说,如果你的机器是32位的,int的长度为32位,如果你的机器是64位的,那么int的标准长度就是64位,而vc中__int64是为在32机位机器长实现64位长度的整形数。
(10)关于32位平台下的int和long
long从字面上看,应该是64位才更合理,把long当成32位实在是一个历史的包袱。像C#那样新起炉灶的程序语言,由于没有需要支持老代码的问题,就把long当作64位来处理了。在32位平台下,long是相对short而言,long(short)类型是long(short) int类型的简称,sizeof(long) = sizeof(int) = 4。int和long的范围虽然一样,但输入输出格式不同,printf int的格式为%d,而printf long的格式为%ld。
考虑到程序的可移植性,还是要将他们区分开来。但当要求的数值范围为4byte时,建议使用int类型,因为第一版的C语言只有一种类型,那就是int。
(11)在Win32 API及MFC中为了使类型名称在语意上更明了,对以上基本类型进行了大量的typedef。例如WINDEF.H中的BYTE,WORD,DWORD。
(12)计算机内部内存的基本单位是1byte(8个电子开关)!
Tips:
ANSI标准规定一个字符为1个字节或多个字节,UNICODE为宽字节字符串或者UNICODE字符串,规定,每个字符都占两个字节。如"中国123",ANSI编码为5字节,在UNICODE中为10字节。
Unicode和ANSI的区别就相当于输入法内的“全角”和“半角”的区别。
由于不同 ANSI 编码所规定的标准是不相同的(字符集不同),因此,对于一个给定的多字节字符串,我们必须知道它采用的是哪一种字符集则,才能够知道它包含了哪些“字符”。而对于 UNICODE 字符串来说,不管在什么环境下,它所代表的“字符”内容总是不变的。Unicode 有着统一的标准,它定义了世界上绝大多数的字符的编码,使得拉丁文、数字、简体中文、繁体中文、日文都能一同一种编码方式保存。
如ANSI标准规定一个字符为1个字节或多个字节,UNICODE为宽字节字符串或者UNICODE字符串,规定,每个字符都占两个字节。如"中国123",ANSI编码为5字节,在UNICODE中为10字节。
参考:
- 《MFC/windows基本数据类型》
- 《从char/wchar_t到TCHAR(1)》《从char/wchar_t到TCHAR(2)》
- 《C# 基本数据类型》
- 《32位还是64位》
- http://www.linux-cn.com/html/linux/other/20070509/32479.html
- 《Windows数据类型探幽》
- http://dev.csdn.net/article/26/26136.shtm
- http://dev.csdn.net/article/26/26137.shtm
- http://dev.csdn.net/article/26/26138.shtm
- http://dev.csdn.net/article/26/26139.shtm
- 《针对 C/C++ 开发人员采用 Windows 64 位》
- http://www.microsoft.com/china/MSDN/library/Windev/64bit/MW6TWPchapter5.mspx?mfr=true
- http://apps.hi.baidu.com/share/detail/2214498
- http://gideshi.blog.163.com/blog/static/899180342008111785544487/
浙公网安备 33010602011771号