理解有符号数和无符号数

http://www.cnblogs.com/lazycoding/archive/2011/03/21/unsigned-signed.html

声明网上看到的文章，原文找不到了，原文被转载的不成样子，重复很多，整理花了很长时间，在翻看了维基百科后发现，原文中对于负数原码和补码存在一些问题，修改了一部分，原作者看到后可以联系我。

1、你自已决定是否需要有正负。

就像我们必须决定某个量使用整数还是实数，使用多大的范围数一样，我们必须自已决定某个量是否需要正负。如果这个量不会有负值，那么我们可以定它为带正负的类型。

在计算机中，可以区分正负的类型，称为有符类型（signed），无正负的类型（只有正值），称为无符类型。（unsigned）数值类型分为整型或实型，其中整型又分为无符类型或有符类型，而实型则只有符类型。字符类型也分为有符和无符类型。比如有两个量，年龄和库存，我们可以定前者为无符的字符类型，后者定为有符的整数类型。

2、使用二制数中的最高位表示正负。

首先得知道最高位是哪一位？1个字节的类型，如字符类型，最高位是第7位，2个字节的数，最高位是第15位，4个字节的数，最高位是第31位。不同长度的数值类型，其最高位也就不同，但总是最左边的那位（如下示意）。字符类型固定是1个字节，所以最高位总是第7位。

(红色为最高位)

单字节数： 11111111

双字节数： 11111111 11111111

四字节数： 11111111 11111111 11111111 11111111

　当我们指定一个数量是无符号类型时，那么其最高位的1或0，和其它位一样，用来表示该数的大小。

当我们指定一个数量是无符号类型时，此时，最高数称为“符号位”。为1时，表示该数为负值，为0时表示为正值。

　 3、无符号数和有符号数的范围区别。

无符号数中，所有的位都用于直接表示该值的大小。有符号数中最高位用于表示正负，所以，当为正值时，该数的最大值就会变小。我们举一个字节的数值对比：

无符号数： 11111111 值：255

1* 2⁷ + 1* 2⁶ + 1* 2⁵ + 1* 2⁴ + 1* 2³ + 1* 2² + 1* 2¹ + 1* 2⁰

有符号数： 01111111 值：127

1* 2⁶ + 1* 2⁵ + 1* 2⁴ + 1* 2³ + 1* 2² + 1* 2¹ + 1* 2⁰

同样是一个字节，无符号数的最大值是255，而有符号数的最大值是127。原因是有符号数中的最高位被挪去表示符号了。并且，我们知道，最高位的权值也是最高的（对于1字节数来说是2的7次方=128），所以仅仅少于一位，最大值一下子减半。

不过，有符号数的长处是它可以表示负数。因此，虽然它的在最大值缩水了，却在负值的方向出现了伸展。我们仍一个字节的数值对比：

无符号数： 0 ----------------- 255

有符号数： -128 --------- 0 ---------- 127

同样是一个字节，无符号的最小值是 0 ，而有符号数的最小值是-128。所以二者能表达的不同的数值的个数都一样是256个。只不过前者表达的是0到255这256个数，后者表达的是-128到+127这256个数。

一个有符号的数据类型的最小值是如何计算出来的呢？

有符号的数据类型的最大值的计算方法完全和无符号一样，只不过它少了一个最高位（见第3点）。但在负值范围内，数值的计算方法不能直接使用1* 26 + 1* 25 的公式进行转换。在计算机中，负数除为最高位为1以外，还采用补码形式进行表达。所以在计算其值前，需要对补码进行还原。
这里，先直观地看一眼补码的形式：

在10进制中：1 表示正1，而加上负号：-1 表示和1相对的负值。

那么，我们会很容易认为在2进制中（1个字节）： 0000 0001 表示正1，则高位为1后：1000 0001应该表示-1。

然而，事实上计算机中的规定有些相反，请看下表：

二进制值（1字节）	十进制值
10000000	-128
10000001	-127
10000010	-126
10000011	-125
……	……
11111110	-2
11111111	-1

首先我们看到，从-1到-128，其二进制的最高位都是1，正如我们前面的学。负数最高为为1

然后我们有些奇怪地发现，1000 0000 并没有拿来表示 -0；而1000 0001也不是拿来直观地表示-1。事实上，-1 用1111 1111来表示。

怎么理解这个问题呢？先得问一句是-1大还是-128大？

当然是 -1 大。-1是最大的负整数。以此对应，计算机中无论是字符类型，或者是整数类型，也无论这个整数是几个字节。它都用全1来表示 -1。比如一个字节的数值中：1111 1111表示-1，那么，1111 1111 - 1 是什么呢？和现实中的计算结果完全一致。1111 1111 - 1 = 1111 1110，而1111 1110就是-2。这样一直减下去，当减到只剩最高位用于表示符号的1以外，其它低位全为0时，就是最小的负值了，在一字节中，最小的负值是1000 0000，也就是-128。

我们以-1为例，来看看不同字节数的整数中，如何表达-1这个数：

字节数	二进制值	十进制值
单字节数	11111111	-1
双字节数	11111111 11111111	-1
四字节数	11111111 11111111 11111111 11111111	-1

可能有同学这时会混了：为什么 1111 1111 有时表示255，有时又表示-1？所以我再强调一下前面所说的第2点：你自已决定一个数是有符号还是无符号的。写程序时，指定一个量是有符号的，那么当这个量的二进制各位上都是1时，它表示的数就是-1；相反，如果事选声明这个量是无符号的，此时它表示的就是该量允许的最大值，对于一个字节的数来说，最大值就是255。

我们已经知道计算机中，所有数据最终都是使用二进制数表达。也已经学会如何将一个10进制数如何转换为二进制数。不过，我们仍然没有学习一个负数如何用二进制表达。
比如，假设有一 int 类型的数，值为5，那么，我们知道它在计算机中表示为：

00000000 00000000 00000000 00000101

5转换成二制是101，不过int类型的数占用4字节（32位），所以前面填了一堆0。现在想知道，-5在计算机中如何表示？在计算机中，负数以其正值的补码形式表达。

什么叫补码呢？这得从原码，反码说起。

原码：一个整数，按照绝对值大小转换成的二进制数，最高为为符号位，称为原码。红色为符号位

比如 00000000 00000000 00000000 00000101 是 5的原码。
10000000 00000000 00000000 00000101 是-5的原码

反码：将二进制除符号位数按位取反，所得的新二进制数称为原二进制数的反码。正数的反码为原码，负数的反码是原码符号位外按位取反。
取反操作指：原为1，得0；原为0，得1。（1变0; 0变1）

正数：正数的反码与原码相同。

负数：负数的反码，符号位为“1”，数值部分按位取反。

比如：将10000000 00000000 00000000 00000101除符号位每一位取反，

得11111111 11111111 11111111 11111010。

称：11111111 11111111 11111111 11111010 是 10000000 00000000 00000000 00000101 的反码。

反码是相互的，所以也可称：

11111111 11111111 11111111 11111010 和 10000000 00000000 00000000 00000101 互为反码。

补码：反码加1称为补码。
正数：正数的补码和原码相同。

负数：按照规则来
也就是说，要得到一个数的补码，先得到反码，然后将反码加上1，所得数称为补码。

11111111 11111111 11111111 11111010 是 10000000 00000000 00000000 00000101（-5）的反码。
加1得11111111 11111111 11111111 11111011

所以，-5 在计算机中表达为：11111111 11111111 11111111 11111011。转换为十六进制：0xFFFFFFFB。

再举一例，我们来看整数-1在计算机中如何表示。

假设这也是一个int类型，那么：

1、先取-1的原码： 10000000 00000000 00000000 00000001

2、除符号位取反得反码：11111111 11111111 11111111 11111110

3、加1得补码： 11111111 11111111 11111111 11111111

可见，－1在计算机里用二进制表达就是全1。16进制为：0xFFFFFF。

计算机中的带符号数用补码表示的优点：

1、负数的补码与对应正数的补码之间的转换可以用同一种方法——求补运算完成，可以简化硬件；
2、可将减法变为加法，省去减法器；
3、无符号数及带符号数的加法运算可以用同一电路完成。

可得出一种心算求补的方法——从最低位开始至找到的第一个1均不变，符号位不变，这之间的各位“求反”(该方法仅用于做题)。

方法

例1

例2

1. 从右边开始，找到第一个'1'

10101001

10101100

2. 反转从这个'1'之后开始到最左边（不包括符号位）的所有位

11010111

11010100

http://www.360doc.com/content/12/0907/00/495229_234737943.shtml

1 无符号和有符号

计算机中用补码表示负数，并且有一定的计算方式；另外，用二进制的最高位表示符号，0表示正数、1表示负数。这种说法本身没错，可是要有一定的解释，不然它就是错的，至少不能解释，为什么字符类型的-1二进制表示是“1111 1111”16进制表示为FF，而不是1000 0001。

在计算机中，可以区分正负的类型，称为有符号类型，无正负的类型，称为无符号类型。

使用二进制中的最高位表示正负

一个字节为8位，按0开始记，那它的最高位就是第7位，2个字节，最高位就是15位，4个字节，最高位是31位，不同长度的类型，最高为业不同，但总是最左边那位。

无符号和有符号数的范围的区别

无符号数中，所有的位都用于直接表示该值的大小；有符号数中最高位用于表示正负，所以，正值时，该数的最大值就会变小：

无符号数：1111 1111 值：255=1*2^7+1*2^6+.....=2^n-1

有符号数：0111 1111 值：127

同样一个字节，无符号的最大值是255，有符号的最大值是127，下图是无符号数和有符号数的范围：

一个由符号的数据类型的最大值的计算方法完全和无符号一样，只不过它少了一个最高位，但是在负数范围内，数值的计算方法不能直接使用前面的公式，在计算机种，负数除了最高位为1以外，还采用补码的形式，所以在计算前，需要对补码进行还原。

以10进制的计算经验，1表示正1，-1表示和1相对的负值。那么很容易想到在二进制中，0000 0001表示正1，则高位为1后：1000 0001应该表示-1，不过实际上，计算机中的规定有些相反：

可以发现，1000 0000没有拿来表示-0，而1000 0001也不能拿来直观地表示-1，事实上，-1用1111 1111来表示。从一个角度来理解，-1大还是-128大，当然是-1大，-1是最大的负整数，所以，无论是字符类型或整数类型，也无论这个整数是几个字节，从计算结果上来看也是对的：1111 1111-1=1111 1110，表示-2，这样一直减下去，当减到只身最高位用于表示符号的1以外，其他低位全为0，就是最小的负值，也就是-128：

2 Java基本数据类型

3 Java符号类型

Java的原始类型里没有无符号类型，如果需要某个宽度的无符号类型，可以用>>>，这个是java的无符号右移操作符，或者使用下一个宽度的带符号类型来模拟，例如，需无符号的short，就用int来模拟：

1 int toUnsigned(short s) {

2 return s & 0x0FFFF;

3 }

十进制的字面常理只有一个特性，就是所有的十进制字面常量都是正数，如果想写一个负的十进制，则需要在正的十进制字面常量前面加上“-”就好了。

十六进制或者八进制的字面常量就不一定是正数或者负数，如果最高位是1，那么就是负数：

1 System.out.println(0x80);//128

2 //0x81看作是int型，最高位(第32位)为0，所以是正数

3 System.out.println(0x81);//129

4 System.out.println(0x8001);//32769

5 System.out.println(0x70000001);//1879048193

6 //字面量0x80000001为int型，最高位(第32位)为1，所以是负数

7 System.out.println(0x80000001);//-2147483647

8 //字面量0x80000001L强制转为long型，最高位（第64位）为0，所以是正数

9 System.out.println(0x80000001L);//2147483649

10 //最小int型

11 System.out.println(0x80000000);//-2147483648

12 //只要超过32位，就需要在字面常量后加L强转long，否则编译时出错

13 System.out.println(0x8000000000000000L);//-922337203685477

4 有符号扩展和无符号扩展

System.out.println(Long.toHexString(0x100000000L + 0xcafebabe));// cafebabe

结果为什么不是0x1cafebabe？该程序执行的加法是一个混合类型的计算：左操作数是long型，而右操作数是int类型。为了执行该计算，Java将int类型的数值用拓宽原生类型转换提升为long类型，然后对两个long类型数值相加。因为int是有符号的整数类型，所以这个转换执行的是符号扩展。

这个加法的右操作数0xcafebabe为32位，将被提升为long类型的数值0xffffffffcafebabeL，之后这个数值加上了左操作0x100000000L。当视为int类型时，经过符号扩展之后的右操作数的高32位是-1，而左操作数的第32位是1，两个数

值相加得到了0：
0x ffffffffcafebabeL
+0x 0000000100000000L
-----------------------------
0x 00000000cafebabeL

如果要得到正确的结果0x1cafebabe，则需在第二个操作数组后加上“L”明确看作是正的long型即可，此时相加时拓

展符号位就为0：

Java代码

1 System.out.println(Long.toHexString(0x100000000L + 0xcafebabeL));// 1cafebabe

5 窄数字类型提升至宽类型时使用符号位扩展还是零扩展

System.out.println((int)(char)(byte)-1);// 65535

结果为什么是65535而不是-1？

窄的整型转换成较宽的整型时符号扩展规则：如果最初的数值类型是有符号的，那么就执行符号扩展（即如果符号位为1，则扩展为1，如果为零，则扩展为0）；如果它是char，那么不管它将要被提升成什么类型，都执行零扩展。

了解上面的规则后，我们再来看看迷题：因为byte是有符号的类型，所以在将byte数值-1（二进制为：11111111）提升到char时，会发生符号位扩展，又符号位为1，所以就补8个1，最后为16个1；然后从char到int的提升时，由于是char型提升到其他类型，所以采用零扩展而不是符号扩展，结果int数值就成了65535。

如果将一个char数值c转型为一个宽度更宽的类型时，只是以零来扩展，但如果清晰表达以零扩展的意图，则可以考虑

使用一个位掩码：

Java代码

1 int i = c & 0xffff;//实质上等同于：int i = c ;

说明：

至于0xff，这属于java的字面常量，他已经是int了，ff表示为11111111，java对这种字面常量，不把他前面的1看做符号位，虽然也是有符号扩展，但是，扩展成的是00...ff.

“数字字面常量”的类型都是int型，而不管他们是几进制，所以“2147483648”、“0x180000000（十六进制，共33位，所以超过了整数的取值范围）”字面常量是错误的，编译时会报超过int的取值范围了，所以要确定以long来表示“2147483648L”、“0x180000000L”。

System.out.println(0x80000001);//-2147483647 ，已经是32位，最高位是符号位

System.out.println(0xcafebabe);//-889275714

System.out.println(0xffff); //65535 int是32位的，最高位已经是0，相当于0X0000ffff

System.out.println(0xff); //255

如果将一个char数值c转型为一个宽度更宽的整型，并且希望有符号扩展，那么就先将char转型为一个short，它与char上个具有同样的宽度，但是它是有符号的：

2 int i = (short)c;

如果将一个byte数值b转型为一个char，并且不希望有符号扩展，那么必须使用一个位掩码来限制它：

3 char c = (char)(b & 0xff);// char c = (char) b;为有符号扩展

((byte)0x90 == 0x90)?

答案是不等的，尽管外表看起来是成立的，但是它却等于false。为了比较byte数值(byte)0x90和int数值0x90，Java

通过拓宽原生类型将byte提升为int，然后比较这两个int数值。因为byte是一个有符号类型，所以这个转换执行的是符号扩展，将负的byte数值提升为了在数字上相等的int值（10010000?111111111111111111111111 10010000）。在本例中，该转换将(byte)0x90提升为int数值-112，它不等于int数值的0x90，即+144。

解决办法：使用一个屏蔽码来消除符号扩展的影响，从而将byte转型为int。

Java代码

1 ((byte)0x90 & 0xff)== 0x90

6 Java中byte转换int时与0xff进行与运算的原因

java中byte转换int时为何与0xff进行与运算

在剖析该问题前请看如下代码
public static String bytes2HexString(byte[] b) {
  String ret = "";
  for (int i = 0; i < b.length; i++) {
   String hex = Integer.toHexString(b[i] & 0xFF);
   if (hex.length() == 1) {
    hex = '0' + hex;
   }
   ret += hex.toUpperCase();
  }
  return ret;
}
上面是将byte[]转化十六进制的字符串,注意这里b[i] & 0xFF将一个byte和 0xFF进行了与运算,然后使用Integer.toHexString取得了十六进制字符串,可以看出
b[i] & 0xFF运算后得出的仍然是个int,那么为何要和 0xFF进行与运算呢?直接Integer.toHexString(b[i]);,将byte强转为int不行吗?答案是不行的.

其原因在于:
1.byte的大小为8bits而int的大小为32bits
2.java的二进制采用的是补码形式

在这里先温习下计算机基础理论

byte是一个字节保存的，有8个位，即8个0、1。
8位的第一个位是符号位，
也就是说0000 0001代表的是数字1
1000 0000代表的就是-1
所以正数最大位0111 1111，也就是数字127
负数最大为1111 1111，也就是数字-128

上面说的是二进制原码，但是在java中采用的是补码的形式，下面介绍下什么是补码

Integer.toHexString的参数是int，如果不进行&0xff，那么当一个byte会转换成int时，由于int是32位，而byte只有8位这时会进行补位，例如补码11111111的十进制数为-1转换为int时变为11111111111111111111111111111111好多1啊，呵呵！即0xffffffff但是这个数是不对的，这种补位就会造成误差。和0xff相与后，高24比特就会被清0了，结果就对了。

补码是有符号数，所以从8位变为int需要有符号扩展，变为11111111111111111111111111111111（最终的值为-1）。

一般在有些编译器重，写ff，会把第一位1认为是符号位，所以可以这么写：0x0ff

7 DataInputStream

DataInputStream in = new DataInputStream(

new BufferedInputStream(fileInputStream));

posted @ 2014-12-01 15:44 ing... 阅读(7116) 评论(0) 收藏举报

刷新页面返回顶部

ing...

理解有符号数和无符号数

1 无符号和有符号

2 Java基本数据类型

3 Java符号类型

4 有符号扩展和无符号扩展

5 窄数字类型提升至宽类型时使用符号位扩展还是零扩展

6 Java中byte转换int时与0xff进行与运算的原因

7 DataInputStream

公告