Vector源码解析

简介

Vector 看上去想一个可增长的数组,可以使用索引访问。他的size随着添加或删除item可大可小。Vector为了优化存储,保存着capacity和capacityIncrement两个变量。capacity最小为vector当前的大小。一般比vector的size要大,当有有数据添加到vector时,vector的大小以capacityIncrement的整数倍增加。

vector的迭代器也是fail-fast的,如果在迭代器创建后vector的结构被修改了(除了调用迭代器本身的remove或者add方法),将会抛出异常。

since v1.2 vector 实现了List接口,而且开始支持多线程。支持多线程的方式是在方法前加上synchronized修饰符,实现对象锁,这种锁的效率很低。

构造函数

Vector的构造函数有如下四个:

    // 可以指定初始容量,和每次扩容的数量
    public Vector(int initialCapacity, int capacityIncrement) {
        super();
        if (initialCapacity < 0)
            throw new IllegalArgumentException("Illegal Capacity: "+
                                                initialCapacity);
        this.elementData = new Object[initialCapacity];
        this.capacityIncrement = capacityIncrement;
    }
    // 调用第一个构造函数,每次扩容数量为0 其内部在扩容时
    // 判断了如果capacityIncrement<= 0 时,直接扩容到原来
    // 容量的两倍,在grow函数中。
    public Vector(int initialCapacity) {
        this(initialCapacity, 0);
    }
    // 默认构造函数,初始容量为10,jdk1.8中ArrayList默认构造函数的初始容量为0在第一调用add时将其初始化为10
    public Vector() {
        this(10);
    }
    // 支持使用集合类创建
    public Vector(Collection<? extends E> c) {
        elementData = c.toArray();
        elementCount = elementData.length;
        // c.toArray might (incorrectly) not return Object[] (see 6260652)
        if (elementData.getClass() != Object[].class)
            elementData = Arrays.copyOf(elementData, elementCount, Object[].class);
    }

扩容机制

vector内部使用数组存储:

protected Object[] elementData;

当数组大小不够用时,它会使用内部的扩容机制扩容。扩容机制写的很严谨,考虑到了int超过最大值的情况。

    // 在添加元素会调用传进来的minCapacity 为当前vector内部的数据个数,加上要增加的数据个数 minCapacity 因为使用的int,在扩容时有可能超过int最大值而变成一个负数
    public synchronized void ensureCapacity(int minCapacity) {
        if (minCapacity > 0) {
            modCount++;
            ensureCapacityHelper(minCapacity);
        }
    }
    private void ensureCapacityHelper(int minCapacity) {
        // overflow-conscious code
        // 如果需要的容量大于当前数组的容量才扩容
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }   
    private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        // 如果构造函数中没有设置capacityIncrement,则扩容到之前容量的两倍
        int newCapacity = oldCapacity + ((capacityIncrement > 0) ?
                                         capacityIncrement : oldCapacity);
        // 如果扩容到原来的两倍还不够用,则使用指定的容量
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
            // 同样考虑超过允许的最大值情况,将调用hugeCapactity
            // MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
            // 虚拟机为数组保留了一些头信息
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        elementData = Arrays.copyOf(elementData, newCapacity);
    }
    // 如果超过Integer.MAX_VALUE-8 则返回int最大值,否则返回Integer.MAX_VALUE-8
    private static int hugeCapacity(int minCapacity) {
        if (minCapacity < 0) // overflow
            throw new OutOfMemoryError();
        return (minCapacity > MAX_ARRAY_SIZE) ?
            Integer.MAX_VALUE :
            MAX_ARRAY_SIZE;
    }

总结一下,在扩容时,如果定义了capacityIncrement,按照capacityIncrement增加,如果capacityIncrement为0,将容量扩大到原来的两倍,扩容后如果还不够用的话,按照实际大小扩容。其中如果扩容后的大小超过了int的最大值,将报错。

枚举器 Enumeration

Vector比ArrayList多提供一个枚举器,类似迭代器。

    public Enumeration<E> elements() {
        return new Enumeration<E>() {
            int count = 0;

            public boolean hasMoreElements() {
                return count < elementCount;
            }

            public E nextElement() {
                synchronized (Vector.this) {
                    if (count < elementCount) {
                        return elementData(count++);
                    }
                }
                throw new NoSuchElementException("Vector Enumeration");
            }
        };
    }

从代码中可以看出其结构很类似interator的内部实现,调用hasMoreElement判断是否还有元素,调用nextElement迭代出下一个元素。但是其内部没有像迭代器中的remove方法,很纯粹,是一个只读的模型。他与迭代器最大的区别是,当枚举创建后,如果对vector的结构做了修改,他不会抛出ConcurrentModificationException。但是如果在代码中像如下的方式使用,还是会出问题。

    public void enumNoFailFastTest() {
        Vector<String> vector = new Vector<>();
        vector.add("chris");
        vector.add("mumu");
        Enumeration<String> enumeration = vector.elements();

        System.out.println(enumeration.nextElement());
        if (enumeration.hasMoreElements()) {
            vector.remove(1);
            System.out.println(enumeration.nextElement());
        }
    }

上述代码运行后抛出异常:java.util.NoSuchElementException: Vector Enumeration。原因是当用hashasMoreElements后,将第二个元素移除了,这时再次调用nextElement时,发现count=1 == elementCount了。这时就会抛出异常。这里是模拟在一个线程在判断还有元素(最后一个元素)后,第二个线程移除了这个元素,第一个线程再访问这个元素就会出错。基于上面的分析,如果在写代码时用到了elements这个函数,需要自己处理线程安全的问题。

其他知识点

除此之外,vector还提供了一些类似数组按照索引访问的功能。例如,indexOf,lastIndexOf,firstElement,lastElement,setElement,removeElement,elementAt等函数,这里不再讲其内部实现。其内部使用了很多一下两个关于数组的函数,对平常coding很有帮助。

    //数组的copy函数
    // src : 从哪个数组copy数据
    // srcPos : 从数组的那个索引开始copy
    // dest : copy 到哪个函数中,
    // destPos : copy的数据从dest的第几个索引开始存储
    // length: copy数据的长度
    System.arraycopy(Object src,  int  srcPos, Object dest, int destPos,int length);
    // 以给定的数据类型,指定的数组长度创建一个数组
    Array.newInstance(newType.getComponentType(), newLength);

Vector支持排序,在排序的过程中,vector如果发生结构变化,也会抛出异常。而排序内部使用Arrays提供的排序方法。

    public synchronized void sort(Comparator<? super E> c) {
        final int expectedModCount = modCount;
        Arrays.sort((E[]) elementData, 0, elementCount, c);
        if (modCount != expectedModCount) {
            throw new ConcurrentModificationException();
        }
        modCount++;
    }

疑问

在vector的源码注解中有一个shrink,意思当删除数据时,他会自动缩小。但是在代码中没有看到关于缩小elementData的操作,只有一个trimTosize()函数。如果非要说他可以缩小所占空间的话,应该指的是这个函数。

posted @ 2018-06-10 12:55  arax  阅读(195)  评论(0编辑  收藏  举报