java之Map源代码浅析

Map是键值对。也是经常使用的数据结构。

Map接口定义了map的基本行为。包含最核心的get和put操作，此接口的定义的方法见下图：

JDK中有不同的的map实现，分别适用于不同的应用场景。如线程安全的hashTable和非线程安全的hashMap.

例如以下图是JDK中map接口的子类UML类图，当中有个特例Dictionary已经不建议使用：

Map接口中的方法我们须要关注的就是get、put 和迭代器相关的方法如entrySet()、keySet()、values()方法。

Entry

在開始分析map之前，首先了解map中元素的存储。我们知道map能够觉得是键值对的集合，java中map使用Entry存储键值对，这是一个接口，其定义例如以下，简单明了。接口方法主要是对键和值进行操作。

interface Entry<K,V> {
   
    K getKey();
 
    V getValue();
 
   V setValue(V value);
 
    boolean equals(Object o);
 
    int hashCode();
    }

AbstractMap

Map接口的抽象实现。见下面演示样例实现代码：

Map<String,String> a = /**
        *
        *抽象map实现示意，依据文档说。和list接口及其相似。
        *
        *map分为可变和不可变两种。不可变仅仅需实现 entrySet方法就可以，且返回的 set的迭代器不能支持改动操作。
        *
        *可变map,须要实现put方法，然后 entrySet的迭代器也须要支持改动操作
        *
        *
        *AbstractMap 里面实现了map的梗概，可是其效率难说，比方其get方法中时採用方法entrySet实现的。

        *
        *通常子类用更有效率的方法覆盖之。
如hashMap中覆盖了keySet 、values 、get方法等
        */
       new AbstractMap<String,String>(){
 
           /*
            * 返回map中的元素集合，返回的集合通常继承AbstractSet 就可以。
            */
           @Override
           public Set<Map.Entry<String, String>> entrySet() {
              return new AbstractSet<Map.Entry<String,String>>() {
 
                  @Override
                  public Iterator<java.util.Map.Entry<String, String>> iterator() {
                     return null;
                  }
 
                  @Override
                  public int size() {
                     return 0;
                  }
              };
           }
          
           /*
            * 默认实现抛出异常，可变map须要实现此方法
            */
           @Override
           public String put(String key, String value) {
             
              return null;
           }
          
       };

HashMap

hashMap继承abstractMap，是相当经常使用的数据结构，採用hash散列的思想。能够在O(1)的时间复杂度内插入和获取数据。其基本实现能够分析上个小节中的抽象方法，文章

浅析HashMap的实现和性能分析已经对hashMap的实现、put和get操作进行了较具体的说明。

这里不再赘述。关键看他的迭代器实现，这里仅仅分析下entrySet()方法，而keySet()和values()方法实现与之中的一个脉相承。

关于迭代器。见以下摘出的部分源代码和相关凝视：

/**
         * 返回map中全部的键值对集合，用于遍历
         */
        public Set<Map.Entry<K,V>> entrySet() {
       return entrySet0();
        }
 
        /**
         * 延迟初始化，仅仅有使用的时候才构建。
         *
         * values()和 keySet()方法也使用了相似的机制
         */
        private Set<Map.Entry<K,V>> entrySet0() {
            Set<Map.Entry<K,V>> es = entrySet;
            return es != null ? es : (entrySet = new EntrySet());
        }
       
       
 
        /**
         * 真正的 enterySet，是一个内部类，其关键实现是迭代器实现。
         *
         * values()和 keySet()方法也相应了相应的内部类。
         * 相应的自己的迭代器实现。关键在于这个迭代器
         *
         */
        private final class EntrySet extends AbstractSet<Map.Entry<K,V>> {
            public Iterator<Map.Entry<K,V>> iterator() {
                return newEntryIterator();
            }
            public boolean contains(Object o) {
                if (!(o instanceof Map.Entry))
                    return false;
                Map.Entry<K,V> e = (Map.Entry<K,V>) o;
                Entry<K,V> candidate = getEntry(e.getKey());
                return candidate != null && candidate.equals(e);
            }
            public boolean remove(Object o) {
                return removeMapping(o) != null;
            }
            public int size() {
                return size;
            }
            public void clear() {
                HashMap.this.clear();
            }
        }
       
       
        /**
         * entrySet迭代器，继承HashIterator，实现next方法。
         * values()和 keySet()方法，也是继承HashIterator。仅仅是实现next 的方法不同。
         *
         * 能够对照下。
         *
         * 关键在于HashIterator
         *
         *
         */
        private final class EntryIterator extends HashIterator<Map.Entry<K,V>> {
            public Map.Entry<K,V> next() {
                return nextEntry();
            }
        }
       
        /**
         *
         *keySet()相应的迭代器
         */
        private final class KeyIterator extends HashIterator<K> {
            public K next() {
                return nextEntry().getKey();
            }
        }
       
       
        /**
         *
         * hashmap entrySet() keySet() values()的通用迭代器
         */
        private abstract class HashIterator<E> implements Iterator<E> {
            Entry<K,V> next;   // next entry to return
            int expectedModCount; // For fast-fail
            int index;     // current slot
            Entry<K,V> current;   // current entry
 
            HashIterator() {
                expectedModCount = modCount;
                if (size > 0) { // advance to first entry
                    Entry[] t = table;
                    //构造时候，在数组中查找第一个不为null的数组元素，即Entry链表，关于hashmap的实现请看
                    //本人前面的博文
                    while (index < t.length && (next = t[index++]) == null)
                        ;
                }
            }
 
            public final boolean hasNext() {
                return next != null;
            }
 
            /**
             * 关键实现，非常easy看懂。查找next的时候，和构造迭代器的时候一样
             */
            final Entry<K,V> nextEntry() {
                if (modCount != expectedModCount)
                    throw new ConcurrentModificationException();
                Entry<K,V> e = next;
                if (e == null)
                    throw new NoSuchElementException();
 
                if ((next = e.next) == null) {
                    Entry[] t = table;
                    while (index < t.length && (next = t[index++]) == null)
                        ;
                }
           current = e;
                return e;
            }
 
            public void remove() {
                if (current == null)
                    throw new IllegalStateException();
                if (modCount != expectedModCount)
                    throw new ConcurrentModificationException();
                Object k = current.key;
                current = null;
                HashMap.this.removeEntryForKey(k);
                expectedModCount = modCount;
            }
 
        }

HashTable

实现和hashMap基本一致，仅仅是在方法上加上了同步操作。

多线程环境能够使用它。只是如今有ConcurrentHashMap了，在高并发的时候，能够用它替换hashtable.

LinkedHashMap

hashMap可能在某些场景下不符合要求，由于放入到当中的元素是无序的。而LinkedHashMap则在一定程度上解决问题。

其在实现上继承了HashMap，在存储上扩展haspMap.enteySet,增加了before、after字段。把hashMap的元素用双向链表连接了起来。这个双向链表决定了它的遍历顺序。

其顺序一般是插入map中的顺序，可是它有一个字段accessOrder当为true时，遍历顺序将是LRU的效果。

研究它的有序性。我们能够从put方法、get方法和遍历的方法入手。首先看get方法：

/**
         * 直接调用父类的getEntry方法。
关键在于
         *  e.recordAccess(this) 这句代码
         */
        public V get(Object key) {
            Entry<K,V> e = (Entry<K,V>)getEntry(key);
            if (e == null)
                return null;
            e.recordAccess(this);
            return e.value;
        }
       
        /**
         * Entry.recordAccess 方法
         *
         * 假设是訪问顺序（accessOrder=true），那么就把它放到头结点的下一个位置
         * 否则什么也不做。
         * 这样就能够依据初始 accessOrder 属性，来决定遍历的顺序。
         */
        void recordAccess(HashMap<K,V> m) {
            LinkedHashMap<K,V> lm = (LinkedHashMap<K,V>)m;
            if (lm.accessOrder) {
                lm.modCount++;
                remove();
                addBefore(lm.header);
            }
        }

Put方法：

/**
         * put方法调用此方法，覆盖了父类中的实现，
         */
        void addEntry(int hash,K key, V value, int bucketIndex) {
            createEntry(hash, key, value, bucketIndex);
 
            // Remove eldest entry if instructed, else grow capacity if appropriate
            Entry<K,V> eldest = header.after;
            //回调。假设有必要移除在老的元素。最新的元素在链表尾部。
            if (removeEldestEntry(eldest)) {
                removeEntryForKey(eldest.key);
            } else {
                if (size >= threshold)
                    resize(2 * table.length);
            }
        }
 
        /**
         *
         */
        void createEntry(int hash,K key, V value, int bucketIndex) {
            HashMap.Entry<K,V> old = table[bucketIndex];
       Entry<K,V> e = new Entry<K,V>(hash, key, value, old);
            table[bucketIndex] = e;
            //本质是插入双向链表的末尾
            e.addBefore(header);
            size++;
        }
       
       
        /**
         * 插入到 existingEntry的前面，由于是双向链表。当existingEntry是 header时。
         * 相当于插入到链表最后。

         *
         */
        private void addBefore(Entry<K,V> existingEntry) {
            after  = existingEntry;
            before = existingEntry.before;
            before.after = this;
            after.before = this;
        }

遍历迭代直接使用双向链表进行迭代接口，这里不赘述。能够看源代码非常easy理解。

注意的是实现上市覆盖了父类中相关的生成迭代器的方法。

TreeMap和CurrentHashMap都能够单独开一篇文章来分析了。这里简单说下。TreeMap是基于b树map，依据key排序。CurrentHashMap是并发包中的一个强大的类，适合多线程高并发时数据读写。

posted @ 2017-05-27 14:33 yxysuanfa 阅读(538) 评论(0) 收藏举报

刷新页面返回顶部

yxysuanfa