学习进展-HashMap源码
前置知识了解
位与 &
(1&1=1 ,1&0=0 ,0&0=0)
位或 |
(1|1=1 ,1|0=1, 0|0=0)
位非 ~
( ~1=0 ,~0=1)
位异或 ^
(1^1=0 ,1^0=1, 0^0=0)
有符号右移 >>
在执行右移操作时,若参与运算的数字为正数,则在高位补0;若为负数,则在高位补1。
无符号右移 >>>
无论参与运算的数字为正数或为负数,在执运算时,都会在高位补0。
左移
对于左移是没有正数跟负数这一说的,因为负数在CPU中是以补码的形式存储的,对于正数左移相当于乘以2的N次幂。
HashMap 在 JDK 中的定义
HashMap继承了AbstractMap 抽象类 ,实现了Map接口 ,其中Map接口定义了键映射到值的规则,而AbstractMap类提供 Map 接口的具体实现,以此来减少实现此接口所需的工作。
public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable {
HashMap源码中的几个重要属性。
// 默认容量 16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; //16
// 最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
// 默认的填充因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//当桶(bucket)上的链表长度大于阈值(或者红黑树的边界值,默认为 8)并且当前数组的长度大于64时,此时此索引位置上的所有数据改为使用红黑树存储。
static final int TREEIFY_THRESHOLD = 8;
// 当桶(bucket)上的结点数小于这个值时树转链表
static final int UNTREEIFY_THRESHOLD = 6;
//链表转变成树之前,还会有一次判断,只有数组长度大于 64 才会发生转换。这是为了避免在哈希表建立初期,多个键值对恰好被放入了同一个链表中而导致不必要的转化。
static final int MIN_TREEIFY_CAPACITY = 64;
// 存储元素的数组,总是2的幂次倍
transient Node<k,v>[] table;
// 存放具体元素的集
transient Set<map.entry<k,v>> entrySet;
// 存放元素的个数,注意这个不等于数组的长度。
transient int size;
// 每次扩容和更改map结构的计数器
transient int modCount;
// 临界值 当实际大小(容量*填充因子)超过临界值时,会进行扩容
int threshold;
// 填充因子
final float loadFactor;
HashMap源码中的构造函数
HashMap(int, float)型构造函数
//一个具有指定初始容量和负载因子的空HashMap 。
public HashMap(int initialCapacity, float loadFactor) {
// 初始容量不能小于0,否则抛出异常
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
// 初始容量如何大于最大容量,将初始容量的值替换成最大容量
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
// 填充因子不能小于或等于0,不能为非数字,否则抛出异常
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
// 初始化填充因子
this.loadFactor = loadFactor;
// 初始化threshold大小
this.threshold = tableSizeFor(initialCapacity);
}
说明:tableSizeFor(initialCapacity)返回大于等于initialCapacity的最小的二次幂数值。
static final int tableSizeFor(int cap) {
//找到的目标值大于或等于原值
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
//该算法让最高位的1后面的位全变为1。最后再让结果n+1,即得到了2的整数次幂的值了。
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
注意:
- |=(或等于):这个符号比较少见,但是“+=”应该都见过,看到这你应该明白了。例如:a |= b ,可以转成:a = a | b。
- >>>(无符号右移):例如 a >>> b 指的是将 a 向右移动 b 指定的位数,右移后左边空出的位用零来填充,移出右边的位被丢弃。
HashMap(int)型构造函数。
构造一个具有指定的初始容量和默认负载因子(0.75) HashMap。
public HashMap(int initialCapacity) {
// 调用HashMap(int, float)型构造函数
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
HashMap()型构造函数。
构造一个空的 HashMap ,默认初始容量(16)和默认负载因子(0.75)
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
HashMap(Map<? extends K>)型构造函数。
public HashMap(Map<? extends K, ? extends V> m) {
// 构造一个空的 HashMap ,默认初始容量(16)和默认负载因子(0.75)
this.loadFactor = DEFAULT_LOAD_FACTOR;
// 将m中的所有元素添加至HashMap中
putMapEntries(m, false);
}
说明:putMapEntries(Map<? extends K, ? extends V> m, boolean evict)函数将m的所有元素存入本HashMap实例中。
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
//获取传入的map集合的大小
int s = m.size();
if (s > 0) {
//如果HashMap没有被初始化
if (table == null) { // pre-size
// s/loadFactor 计算传进来的map的长度是否要达到阈值,因为会计算出小数因此+1.0F向上取整
float ft = ((float)s / loadFactor) + 1.0F;
//如果计算得到的最大负载容量大于最大值,则将t赋值为最大值
//当不大于最大值的时候使用ft的长度
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
//如果大于当前数组下次要扩容的值
if (t > threshold)
//重新计算下次扩容值的大小,在下面putVal方法当中进行map数组的初始化
threshold = tableSizeFor(t);
}
//如果table已经被初始化且传入map的大小大于当前的最大负载容量则开始调整HashMap的大小
else if (s > threshold)
resize();
//将map中的元素逐一添加到HashMap中
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
重要方法分析
putVal函数
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
// 数组是否为空
if ((tab = table) == null || (n = tab.length) == 0)
//初始化数组
n = (tab = resize()).length;
// 计算索引的位置,(n - 1) & hash 相当于对将hash % n,根据hash得到桶的索引
if ((p = tab[i = (n - 1) & hash]) == null)
//当桶内没有元素的时候,实例化一个元素作为桶的第一个元素
tab[i] = newNode(hash, key, value, null);
else {
//当桶内有元素时候,就需要解决hash冲突问题了
// e-临时节点值,用于存放当前hash值对应桶位置的节点元素
Node<K,V> e; K k;
//桶内的第一个元素的key值与新加入key-value的key相同的时候,用e指向p(仅仅指向)
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
//如果此时桶内已经树化,使用putTreeVal方法加入元素,若存在相同的key的元素,则将引用返回
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//如果桶内是链表,则插入链表,这里使用尾插法
for (int binCount = 0; ; ++binCount) {
//当前节点的下一节点为空时,新增一个节点,此时要判断一下当前链表的长度,
//超过指定长度要将链表转换为红黑树
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
//bitCount大于树化的阈值,转化为红黑树
treeifyBin(tab, hash);
break;
}
//当前节点的下一节点是我要插入的节点
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
//桶内存在元素的key值与新加入key-value的key相同的时候,用e指向p(仅仅指向)
p = e;
}
}
//通过上面的code,若map中已经存在相同的key,
//我们则将Node<K,V> e指向该key-value,即Node(TreeNode是Node的子类)
//若e == null,则说明已经插入成功
//若e != null, 则将e.value作为旧值返回,将e.value设置为value
if (e != null) { // existing mapping for key
V oldValue = e.value;
//putVal中的参数。若onlyIfAbsent为null或者oldValue为空时才替换,
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//插入后大于阈值,使用resize()进行调整
if (++size > threshold)
resize();
// 插入后回调
afterNodeInsertion(evict);
return null;
}
注:HashMap并没有直接提供putVal接口给用户调用,而是提供的put函数,而put函数就是通过putVal来插入元素的。
getNode函数
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
//1)数组不为空
//2)数组长度>0
//3)通过hash计算出该元素在数组中存放位置的索引,而且该索引处数据不为空null
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
//判断该数组索引位置处第一个是否为我们要找的元素 判断条件需要满足hash 和 key 相同
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
//如果第一个就是我们要找的,直接返回即可
return first;
//如果第一个不是,我们需要循环遍历,然后找数据
if ((e = first.next) != null) {
//如果第1个的元素是红黑树类型的节点
if (first instanceof TreeNode)
//那我们需要调用红黑树的方法查找节点
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
//如果不是,则该为链表,需要遍历查找
do {
//循环判断下一个节点的hash和key是否相同
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
//更新e为下一个
} while ((e = e.next) != null);
}
}
//没找到返回Null
return null;
}
注:HashMap并没有直接提供getNode接口给用户调用,而是提供的get函数,而get函数就是通过getNode来取得元素的。
resize函数
final Node<K,V>[] resize() {
//旧数组
Node<K,V>[] oldTab = table;
//旧数组容量/长度
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//旧数组扩容阈值/临界值(旧数组容量*负载因子)
int oldThr = threshold;
//新数组容量及新数组扩容阈值
int newCap, newThr = 0;
//如果旧数组容量>0
if (oldCap > 0) {
//如果旧数组容量大于等于最大容量
if (oldCap >= MAXIMUM_CAPACITY) {
//则直接修改旧数组扩容阈值为最大值
threshold = Integer.MAX_VALUE;
//并返回旧数组容量,不再做其他操作
return oldTab;
}
//若旧数组容量小于最大容量且新数组容量扩大至旧数组容量的2倍后依旧小于最大容量,并且//旧数组容量大于等于默认的初始化容量16
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
//则将新数组扩容阈值扩大至旧数组扩容阈值的2倍
newThr = oldThr << 1; // double threshold
}
//若旧数组容量小于等于0,且旧数组扩容阈值大于0(当new HashMap(0)后再put时,会走到这里)
else if (oldThr > 0) // initial capacity was placed in threshold
//则将旧数组扩容阈值赋给新数组容量
newCap = oldThr;
//若旧数组容量和旧数组扩容阈值均不大于0,说明数组需要初始化
else { // zero initial threshold signifies using defaults
//将新数组容量设为默认初始化容量16
newCap = DEFAULT_INITIAL_CAPACITY;
//将新数组扩容阈值设为默认负载因子0.75*默认初始化容量16=12
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//经上述逻辑后新数组扩容阈值仍为0,说明新数组扩容阈值尚未处理过,
//但走到这里之前新数组容量已经被处理完了,所以需按照新数组容量*负载因子的公式重新计算
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
//将新数组扩容阈值赋值给HashMap的扩容阈值字段
threshold = newThr;
//按照新数组容量创建新数组
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//将创建的新数组赋值给HashMap的数组字段
table = newTab;
//若旧数组不为null,则需要将旧数组中的数组迁移到新数组中,并将旧数组各位置置为null.
if (oldTab != null) {
//根据旧数组长度,循环遍历各数组索引下标
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
//判断每个数组索引位置对应的链表的头节点是否为空,若为空则该索引位置无数据,
//就不需要接下来的操作,不为空才继续往下进行处理,将该链表的数据转移赋值给新数组
if ((e = oldTab[j]) != null) {
//将旧数组该位置置为null,提醒gc回收
oldTab[j] = null;
//头节点无后续节点,说明只需将头节点移动到新数组
if (e.next == null)
//根据新数组长度和该链表头节点已有的hash重新计算该链表头节点在新数组中的索引下标位置,并将头节点直接赋值给新数组的该索引下标。
newTab[e.hash & (newCap - 1)] = e;
//判断链表头节点类型是否是红黑树
else if (e instanceof TreeNode)
//将树中的数据从旧数组移到新数组
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
//走到这里,说明链表头节点有后续节点,后面会保留原有链表的顺序进行新旧数组的数据转移
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
//用于循环递进链表(若链表上有多个节点),保持原链表的顺序
next = e.next;
if ((e.hash & oldCap) == 0) {
//低位链表的末尾为null, 对于每个链表来说,说明是第一次走到这里,
//而且此处也只会走进来一次,因为后续会将非null的e赋值给loTail了。
if (loTail == null)
//说明e为低位链表头节点,并将其赋给代表低位链表头节点的loHead
loHead = e;
//说明低位链表末尾不为null,说明至少处理过一次loTail了,
//即头节点肯定已经处理过了,下面应该去处理低位链表头节点的后续节点了
else
loTail.next = e;
loTail = e;
}
else {
//高位链表的末尾为null,对于每个链表来说,说明是第一次走到这里,
//而且此处也只会走进来一次,因为后续会将非null的赋值给hiTail了。
if (hiTail == null)
//说明e为高位链表头节点,并将其赋给代表高位链表头节点的hiTail
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
//链表后续还有节点时,才继续处理,否则跳出循环
} while ((e = next) != null);
//低位链表尾节点不为空,说明旧数组向低位链表的数据转移已处理完,可做进一步处理
if (loTail != null) {
//要保证低位链表尾节点的后续节点为null
loTail.next = null;
//loHead代表了低位链表的头节点,
//也就代表了整条低位链表(其上已经将旧数组中j索引位置上的链表里的所有节点都转移到了该低位链表上),
//而从前面的处理逻辑可知,低位链表移动到新数组时的索引下标位置,与在旧数组上的索引位置相同
//故直接将低位链表头节点赋给新数组的j索引下标位置即完成转移。
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
//返回处理完的新数组
return newTab;
}
参考链接
4.数组扩容源码

浙公网安备 33010602011771号