Hash（散列函数）简单应用引出解决散列冲突的四种方法

商店允许顾客通过电话订购商品，并在几天后上门自取。商店的数据库使用客户的电话号码作为其检索的关键字（客户知道自己的电话号码，而且这些电话关键字几乎是唯一的）。如何组织商店的数据库，以允许更加高效的进行插入和检索操作呢？

将纸质订单表格放在10x10的箱数组中，使用客户电话号码的后两位作为散列索引（为什么将后两位作为索引而不是前两位），将订单放到合适的箱子格中。当客户来取商品时，销售人员顺序搜索对应箱子中的所有订单——这就是利用顺序搜索来解决散列冲突的开放散列。

非哈希表特点：关键字在表中的位置和本身没有确定的关系，检索的过程将每个关键字与数据库中的关键字进行比较，查找的效率取决于比较的次数（如果为顺序组织，可以进行二分检索，时间复杂度为O(log(n))；如果为非顺序组织，只能顺序检索，时间复杂度为O(n)）。

哈希表的特点：关键字与他的位置有确定的关系，因此插入和检索都非常方便。关键问题：1、设计好的散列函数，使得各种可能的结果尽可能随机　2、当冲突出现时，如何解决冲突

1、开放定址法

假如多个关键字key0,key1,key2,...keys经过散列函数映射为同一地址，即产生地址冲突，那么可以为这些keyi(0<=i<=s)求得一个地址序列。

H0 = H(key0) Hi = ( H(keyi) + di ) mod m

对增量id有两种取法：1、di = 1,2,3,... （线性探测再散列） 2、 di = 1,-1,2,-2,4,-4,......k²,-k²（平方探测再散列）

2、链地址法

将哈希地址相同的元素链接在同一链表中

3、再哈希法

通过另一个哈希函数计算新的地址值，直到不冲突为止

4、建立公共溢出区

posted @ 2018-03-19 00:16 赵永驰阅读(204) 评论(0) 编辑收藏举报

刷新页面返回顶部

赵永驰