数据结构笔记第七章哈希表 Java中的hashCode()和equals()解析

Data Structure Notes
Author : "Carrawayang"
Version : 1.0
Refresh Date 2020.11.26
Description : 
Just record and review some points about Data Structure.
Have mistakes that please correct it yourself.
hash Code是什么？
1.哈希函数Hash Function

需求：通过一种办法：预先知道所查关键字在表中的位置

要求：记录在表中位置和其关键字之间存在一种确定的关系

需在关键字与记录在表中的存储位置之间建立一个函数关系，以 f(key) 作为关键字为 key 的记录在表中的位置，通常称这个函数 f(key) 为哈希函数

\[f(key)=location \]
例如：

为每年招收的 1000 名新生建立一张查找表，其关键字为学号，其值的范围为 xx000 ~ xx999 (前两位为年份)

若以下标为000 ~ 999 的顺序表表示之。

则查找过程可以简单进行：取给定值（学号）的后三位，不需要经过比较便可直接从顺序表中找到待查关键字。

对于动态查找表

1)表厂不确定

2)在设计查找表时，只知道关键字所在范围，而不知道确切的关键字

因此在一般情况下，需在关键字与记录在表中的存储位置之间建立一个函数关系，以 f(key) 作为关键字为 key 的记录在表中的位置，通常称这个函数 f(key) 为哈希函数。

例如

对于如下 9 个关键字,{Zhao, Qian, Sun, Li, Wu, Chen, Han, Ye, Dei} ,设哈希函数

\[f(key) = (Ord(第一个字母) -Ord('A')+1)/2 \]

0 1 2 3 4 5 6 7 8 9 10 11 12 13

Chen Dei Han Li Qian Sun Wu Ye Zhao

问题: 若添加关键字 Zhou , 怎么办？能否找到另一个哈希函数？

从这个例子可见:

哈希(Hash)函数是一个映象，即：
将关键字的集合映射到某个地址集合上，
它的设置很灵活，只要这个地址集合的
大小不超出允许范围即可

由于哈希函数是一个压缩映象，因此，在一般情况下，很容易产生“冲突”现象，即：

\[key1≠key2,而f(key1) = f(key2) \]

很难找到一个不产生冲突的哈希函数。
一般情况下，只能选择恰当的哈希函数，使冲突尽可能少地产生

因此，在构造这种特殊的“查找表” 时，除了需要选择一个“好”(尽可能少产生冲突)的哈希函数之外;还需要找到一种“处理冲突” 的方法

2.哈希表Hash Table
1)定义

根据设定的哈希函数 H(key) 和所选中的处理冲突的方法，将一组关键字映象到一个有限的、地址连续的地址集 (区间) 上，并以关键字在地址集中的“象”作为相应记录在表中的存储位置，如此构造所得的查找表称之为“哈希表”

2)构造哈希函数的方法

对数字的关键字可由以下构造方法：

（1）直接定址法

哈希函数为关键字的线性函数

\[H(key) = key \]
\[H(key) = a * key + b \]
此法仅适合于：
地址集合的大小 = = 关键字集合的大小

（2）数字分析法

假设关键字集合中的每个关键字都是由 s 位数字组成 (u1, u2, …, us)，分析关键字集中的全体，并从中提取分布均匀的若干位或它们的组合作为地址

此方法仅适合于：能预先估计出全体关键字的每一位上各种数字出现的频度

（3）平方取中法

以关键字的平方值的中间几位作为存储地址。求“关键字的平方值” 的目的是“扩大差别” ，同时平方值的中间各位又能受到整个关键字中各位的影响

此方法适合于: 关键字中的每一位都有某些数字重复出现频度很高的现象

（4）折叠法

将关键字分割成若干部分，然后取它们的叠加和为哈希地址。有两种叠加处理的方法：移位叠加和间界叠加

此方法适合于: 关键字的数字位数特别多。

（5）除留余数法

设定哈希函数为:

\[H(key) = key MOD p \]
其中p≤m (表长)并且p应为不大于m的素数或是
不含20以下的质因子

为什么要对 p 加限制？

例如

给定一组关键字为: 12, 39, 18, 24, 33, 21，若取 p=9, 则他们对应的哈希函数值将为: 3, 3, 0, 6, 6, 3

可见，若 p 中含质因子 3, 则所有含质因子 3 的关键字均映射到“3 的倍数”的地址上，从而增加了“冲突”的可能

（6）随机数法

设定哈希函数为:

\[H(key) = Random(key) \]
其中，Random 为伪随机函数

通常此方法用于对长度不等的关键字构造哈希函数。

若是非数字关键字，则需先对其进行数字化处理

实际造表时，采用何种构造哈希函数的方法取决于建表的关键字集合的情况(包括关键字的范围和形态)，总的原则是使产生冲突的可能性降到尽可能地小。

3.处理冲突的方法
“处理冲突” 的实际含义是：
为产生冲突的地址寻找下一个哈希地址

>1）开放定址法
>
>2）再哈希法
>
>3）链地址法

0	1	2	3	4	5	6	7	8	9	10	11	12	13
	Chen	Dei		Han		Li		Qian	Sun		Wu	Ye	Zhao

posted on 2020-12-02 15:43 blueskylabor 阅读(107) 评论(0) 收藏举报

刷新页面返回顶部

数据结构笔记第七章哈希表 Java中的hashCode()和equals()解析

蓝翔技工

公告

导航

数据结构笔记第七章 哈希表 Java中的hashCode()和equals()解析

蓝翔技工

公告

导航

数据结构笔记第七章哈希表 Java中的hashCode()和equals()解析