为什么Hashtab的大小通常取远离2^n 的素数

举个栗子

在Hashtab中我们通常 Hash(key) % M 来确定 key 所需要存放的位置

M就是Hashtab的大小,假设下面的两个场景

Hash(key1) = 108
Hash(key2) = 500

如果 M 恰好是 2^n,我们在这里假设M为2^3=8

Hash(key1) % M = 108 % 8 = 4

Hash(key2) % M = 500% 8 = 4

此时最后的结果只会在 [000,111]

也就是 0-7之间 ( 这个111指的是二进制)

因为任何的数表示成二进制,然后和另一个2^n取余,二进制串中大于n位的就会被消掉

eg : 108 : 1101100 8 : 1000 500 111110100

108 % 8 = 1101100 % 1000 = 1101 100 注意: 只与最后三位有关系,其余的在余的过程会被消除。

500也是同理,这样就大大增加了Hash冲突的概率。

但是如果是一个素数的话,并且最好远离2^n的话,情况就不同了。

108 % 53 = 2
500 % 53 = 23

明显好了许多。

STL HashTab中用的素数表就是 : http://planetmath.org/goodhashtableprimes

posted on 2017-03-11 10:27  杨博东的博客  阅读(23)  评论(0编辑  收藏  举报

导航