南风知我不易

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

Integer中的奇妙位运算

参考资料

https://segmentfault.com/a/1190000015763941

highestOneBit(int i)

函数的作用是获得传入参数的最高位的1,对于正数来说返回值为小于i的最大二次幂,对于负数来说永远是负数的最大值即-2^31

例如:7=0000 0111(省略前24位0)那么函数的返回值为 0000 0100=4

暴力法

通常来说最直观的做法就是暴力法,我一个一个数不就好了

//一位一位取就是了
public int heigestOneBit(int i){
    int res=1;
    if (i<0)return Integer.MIN_VALUE;
    while(i!=0){
        if (i!=1){
            res*=2;
        }
        i/=2;
    }
    return res;
}

位运算

看看JDK如何利用更加高效的位操作实现这一个函数

public static int highestOneBit(int i) {
    // HD, Figure 3-1
    i |= (i >>  1);
    i |= (i >>  2);
    i |= (i >>  4);
    i |= (i >>  8);
    i |= (i >> 16);
    return i - (i >>> 1);
}

为什么JDK一通位操作就把最高位取出来了呢?非常的巧妙啊,举例说明,看以下就知道了

//以下以数字为例,其中x表示0或者1不影响结果,1-最高位的1
i               0000 001x xxxx xxxx xxxx xxxx xxxx xxxx
i>>1		0000 0001 xxxx xxxx xxxx xxxx xxxx xxxx
i|=(i>>1)	0000 0011 xxxx xxxx xxxx xxxx xxxx xxxx

i		0000 0011 xxxx xxxx xxxx xxxx xxxx xxxx
i>>2		0000 0000 11xx xxxx xxxx xxxx xxxx xxxx
i|=(i>>2)	0000 0011 11xx xxxx xxxx xxxx xxxx xxxx

i		0000 0011 11xx xxxx xxxx xxxx xxxx xxxx
i>>4		0000 0000 0011 11xx xxxx xxxx xxxx xxxx
i|=(i>>4)	0000 0011 1111 11xx xxxx xxxx xxxx xxxx

i		0000 0011 1111 11xx xxxx xxxx xxxx xxxx
i>>8		0000 0000 0000 0011 1111 11xx xxxx xxxx
i|=(i>>8)	0000 0011 1111 1111 1111 11xx xxxx xxxx

i		0000 0011 1111 1111 1111 11xx xxxx xxxx
i>>16		0000 0000 0000 0000 0000 0011 1111 1111
i|=(i>>16)	0000 0011 1111 1111 1111 1111 1111 1111

i		0000 0011 1111 1111 1111 1111 1111 1111
i>>>1		0000 0001 1111 1111 1111 1111 1111 1111
i-(i>>>1)	0000 0010 0000 0000 0000 0000 0000 0000

看完上面的简单分析应该就知道JDK如何实现的了,简单来说就是把第一个1不断往后移动,使得从第一个1之后的所有比特位都为1,此时减去右移一位的值,也就是减去后面所有的1代表的值,此时自然只剩下第一个1了,可以说非常的巧妙了

bitCount(int i)

该方法的作用是统计一个整数的二进制表示形式中1的个数,没记错的话这其实也是leetcode中的一道题

首先还是我们自己来思考一下如何实现:

暴力法

一个bit一个bit计数

public static int bitCount(int i){
    //暴力法
    int count=0;
    while(i!=0){
        if ((i&1)==1){
            count++;
        }
        i=i>>>1;
    }
    return count;
}

位运算优化一下

试想对于二进制 100,1的个数为1,按照暴力法需要3次才能统计出来,怎么样一次统计出来呢,也就是怎么一次就把100变成0呢?

对于1xxx这样的数字,x代表0,以100为例,100-1=011,而100&011恰好为0,能做多少次这样的运算,它就有多少位1,代码如下

public static int bitCount(int i){
    //位运算优化
    int count=0;
    while(i!=0){
        i=i&(i-1);
        count++;
    }
    return count;
}

到这里,有多少位的1,就统计多少次,貌似看起来已经还算不错了

JDK的位运算

public static int bitCount(int i) {
    // HD, Figure 5-2
    i = i - ((i >>> 1) & 0x55555555);
    i = (i & 0x33333333) + ((i >>> 2) & 0x33333333);
    i = (i + (i >>> 4)) & 0x0f0f0f0f;
    i = i + (i >>> 8);
    i = i + (i >>> 16);
    return i & 0x3f;
}

Superise Mother Fxxk!这是在干什么?首先解释一下总体的思想

//要统计如下二进制的:1001 1010 1010 1010 的1的位数
//JDK是这样做的
先每两个bit统计有多少个1,然后就保存在二进制的本地
10 01 10 10 10 10 10 10
01 01 01 01 01 01 01 01
然后再统计连续四个bit有多少个1,然后保存在本地
0010 0010 0010 0010
再统计8个bit有多少个1,保存在本地
0000 0100 0000 0100
然后再统计每16个比特有多少个1,保存再本地
0000 0000 0000 1000 ==8总共8个1

有了整体的算法思想,来看看这几个奇怪的数字0x555555550x333333330x0f0f0f0f

他们对应的二进制如下:

0x55555555			01010101010101010101010101010101
0x33333333			00110011001100110011001100110011
0x0f0f0f0f			00001111000011110000111100001111

针对0x55555555来看看效果,怎么把两个相邻bit位中的1存储下来,

//以12345为例
12345				0000 0000 0000 0000 0011 0000 0011 1001
0x55555555			0101 0101 0101 0101 0101 0101 0101 0101
12345&
0x55555555			0000 0000 0000 0000 0001 0000 0001 0001
//可以看到相当于把两个相邻的比特位的后一位的1全部取出来了
12345>>>1			0000 0000 0000 0000 0001 1000 0001 1100
0x55555555			0101 0101 0101 0101 0101 0101 0101 0101
12345>>>1
&0x55555555			0000 0000 0000 0000 0001 0000 0001 0100
//可以看到相当于把两个相邻的比特位的前一位的1全部取出来了
12345				00 00 00 00 00 00 00 00 00 11 00 00 00 11 10 01
last 1				00 00 00 00 00 00 00 00 00 01 00 00 00 01 00 01
first 1				00 00 00 00 00 00 00 00 00 01 00 00 00 01 01 00
last1+fisrt1		00 00 00 00 00 00 00 00 00 10 00 00 00 10 01 01
//可以看到两位中的1的数量已经用两个bit来保存了

算法实现如下:

public static int bitCount(int i) {
    i = (i & 0x55555555) + ((i >>> 1) & 0x55555555);
    i = (i & 0x33333333) + ((i >>> 2) & 0x33333333);
    i = (i & 0x0f0f0f0f) + ((i >>> 4) & 0x0f0f0f0f);
    i = (i & 0x00ff00ff) + ((i >>> 8) & 0x00ff00ff);
    i = (i & 0x0000ffff) + ((i >>> 16) & 0x0000ffff);
    return i;
}

JDK再做点优化即可

  • 第一步,对于 11 这两个比特位来说,用 01 + 01 的方式可以得到 10 也可以用 11 - 01 的方式,所以可以少做一次位运算
  • 第三步,统计两个 4个连续bit 中1的个数,例如 0011 0011 -> 0000 1100 ,而8个bit最多就8个1,用4个bit就可以表示了,所以可以先加,0011 1100,再消除,0000 1100,第四步第五步同理,前面的留着不管,最后返回的时候把前面的bit置0
  • return i & 0x3f,32位的int,最多就32个1,所以取后六位即可表示所有的可能

上述两者的使用

上面两个方法均在HashMap(JDK7实现)中的roundroundUpToPowerOf2方法中被调用,HashMap的分析详见https://www.cnblogs.com/danzZ/p/14075147.html,还是非常有意思的

posted on 2020-12-03 11:22  南风知我不易  阅读(410)  评论(0编辑  收藏  举报