算法6-4：哈希表现状

战争故事

非常久非常久以前，以前发生过非常多关于哈希函数的战争故事。

那些战争的基本原理就是通过精心构造造成大量的哈希冲突从而占用大量的CPU资源。

被攻击的软件例有下面样例：

在Java中的String对象非常easy构造哈系冲突。下图展示了Java中哈系冲突的样例。

使用更加高级的哈系函数。避免冲突。比方md4 md5 sha0 sha1 sha2 whirlpool ripemd160。可是md4 md5 sha0 sha1眼下可以找到缺陷，关于MD5的冲突请戳这里：http://www.links.org/?

MD5不适合用于关联数组，由于开销太大。

眼下介绍了两种解决冲突的办法，各自是独立链表和线性探针。

独立链表：

线性探针：

眼下已经实现了非常多不同的哈希算法。

双值哈希：

一个哈希函数返回两个哈希值，插入元素时插入到较短的链条上。

这样的方法可以降低链条长度的期望值。

双重哈希：

使用线性探针方法，可是每次冲突之后跳过不同数量的元素来寻找空位。

这样的方法可以非常好地消除连续的占位。使得哈希表可以被差点儿填满，可是删除非常难实现。

Cuckoo哈希：

先产生一个哈希，计算出一个位置，假设有冲突。再添加一些參数继续哈希，计算出另外一个位置。直到找到空位位置。这样的方法的查找操作在最坏情况下复杂度是N。

哈希表和平衡树都能够实现关联数组。

哈希表：

二叉树：

Java库中对于这两种方法都有实现。

java.util.TreeMap java.util.TreeSet是通过红黑树实现的，java.util.HashMap java.util.IdentityHashMap是通过哈希表实现的。

posted @ 2017-06-15 19:24 llguanli 阅读(313) 评论(0) 收藏举报

刷新页面返回顶部