Hash详解

对于Hash，我们是怎样来处理冲突的。现在就来介绍一些经典的Hash冲突处理的方法。主要包括

（1）开放地址法

（2）拉链法

（3）再哈希法

（4）建立公共溢出区

（1）开放地址法

基本思想：当发生地址冲突时，按照某种方法继续探测Hash表中其它存储单元，直到找到空位置为止。描述如下

其中，为关键字的直接Hash地址，为Hash表的长度，为

每次再探测时的地址增量。根据的不同取法，有不同的称呼。

线性探测再散列

二次探测再散列

伪随机再散列伪随机数

（2）拉链法

拉链法又叫链地址法，适合处理冲突比较严重的情况。基本思想是把所有关键字为同义词的记录存储在同一个

线性链表中。

代码：

[cpp]view
 plain copy

#include <iostream>  

#include <string.h>  

#include <stdio.h>  

using namespace std;  

const int N = 35;  

struct node  

{  

    int key;    //关键字  

    int len;    //每个节点引出的链表长度  

    bool flag;  //有数据的标志  

    node *next;  

};  

node list[N];  

void Init(node list[])  

{  

    for(int i=0; i<N; i++)  

    {  

        list[i].len = 0;  

        list[i].flag = 0;  

        list[i].next = NULL;  

    }  

}  

void Insert(node list[], int val, int m)  

{  

    int id = val % m;  

    if(!list[id].flag)  

    {  

        list[id].key = val;  

        list[id].flag = 1;  

    }  

    else  

    {  

        node *p = new node();  

        p->key = val;  

        p->next = list[id].next;  

        list[id].next = p;  

    }  

}  

//输出HashTable  

void Print(node list[], int m)  

{  

    for(int i=0; i<m; i++)  

    {  

        node *p = list[i].next;  

        if(!list[i].flag)  

            printf("The %dth record is NULL!\n", i);  

        else  

        {  

            printf("The %dth record is %d", i, list[i].key);  

            list[i].len++;  

            while(p)  

            {  

                printf("->%d", p->key);  

                p = p->next;  

                list[i].len++;  

            }  

            puts("");  

        }  

    }  

}  

//计算平均查找长度  

double ASL(node list[], int m)  

{  

    double ans = 0;  

    for(int i=0; i<m; i++)  

        ans += (list[i].len + 1) * list[i].len / 2.0;  

    return ans / m;  

}  

int main()  

{  

    int n, m;  

    Init(list);  

    scanf("%d %d", &n, &m);  

    for(int i=0; i<n; i++)  

    {  

        int val;  

        scanf("%d", &val);  

        Insert(list, val, m);  

    }  

    Print(list, m);  

    printf("The Average Search Length is %.5lf\n", ASL(list, m));  

    return 0;  

}  

/** 

12 11 

47 7 29 11 16 92 22 8 3 37 89 50 

*/

关于拉链法还可以参考：http://www.51nod.com/question/index.html#!questionId=1191

（3）再哈希法

再哈希法又叫双哈希法，有多个不同的Hash函数，当发生冲突时，使用第二个，第三个，....，等哈希函数

计算地址，直到无冲突。虽然不易发生聚集，但是增加了计算时间。

（4）建立公共溢出区

建立公共溢出区的基本思想是：假设哈希函数的值域是[1,m-1]，则设向量HashTable[0...m-1]为基本

表，每个分量存放一个记录，另外设向量OverTable[0...v]为溢出表，所有关键字和基本表中关键字为同义

词的记录，不管它们由哈希函数得到的哈希地址是什么，一旦发生冲突，都填入溢出表。

来源：http://blog.csdn.net/ACdreamers/article/details/38980951

posted @ 2018-02-23 10:33 绍兴土匪阅读(282) 评论(0) 收藏举报

刷新页面返回顶部

kcfzyhq

自己选择的路，就算跪着也要走完

Hash详解

公告