关于java集合类ArrayList的理解

一、 ArrayList概述:  

    a.ArrayList是基于数组实现的,是一个动态数组,其容量能自动增长,类似于C语言中的动态申请内存,动态增长内存。

  为什么说ArrayList是基于数组实现的,看看jdk源码ArrayList的构造函数

  

  

  所以准确的说,这个数组是一个Object数组

   还有一个带参数的构造函数,它是初始化时指定数组的大小。

  

  那为什么说ArrayList容量能自动增长,容量Capacity是Java后引进的概念,以区别数组的Length。把私有数组预先实例化,然后通过copyOf方法覆盖原数组,是实现自动化改变ArrayList的大小(size)的关键。  

  上面这些都可以在源代码里找到,有三点需要说下

  ①虽然无参数的构造函数初始化的是空数组,但是后面会有判断 if (elementData == EMPTY_ELEMENTDATA) {minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);},所以默认还是10

  ②通过copyOf方法覆盖原数组应该是这段代码elementData = Arrays.copyOf(elementData, newCapacity);

  ③每次add前如果发现容量不足,会自动扩容,新的容量是int newCapacity = oldCapacity + (oldCapacity >> 1);也就是原有容量的1.5倍。然后通过底层的复制方法(第②点)将原有数据复制过来。

  综上得出结论:如果可预知数据量的多少,可在构造ArrayList时指定其容量。在添加大量元素前,应用程序也可以使用ensureCapacity操作来增加ArrayList实例的容量,这可以减少递增式再分配的数量。 注意,此实现不是同步的。如果多个线程同时访问一个ArrayList实例,而其中至少一个线程从结构上修改了列表,那么它必须保持外部同步。

 

      b.ArrayList不是线程安全的,只能用在单线程环境下,多线程环境下可以考虑用Collections.synchronizedList(List l)函数返回一个线程安全的ArrayList类,也可以使用concurrent并发包下的CopyOnWriteArrayList类。

    为什么说 ArrayList不是线程安全的?看看jdk里ArrayList的add方法是如何写的

     

  问题就出在size++这边,主要分为两个步骤:

      1)将add的元素放到size位置

      2)将size加1

  假设size=5.若线程A在5位置存放了值valueA,获得size=5,但还没来得及将size加1写入主存。此时线程B在也在5位置存放了值valueB,也获得size=5,而后A、B分别将size加1后写入主存,size=6,即两个线程执行两次add()后size只加了1。

  下面写个程序验证:

 1 public class Run {
 2     static ArrayList<String> li = new ArrayList<String>();
 3     public static void main(String[] args) {
 4         for (int i = 0; i < 100; i++) {
 5             new Thread(new Runnable() {
 6                 @Override
 7                 public void run() {
 8                     li.add("");
 9                 }
10             }).start();
11         }
12         while (true) {
13             try {
14                 Thread.sleep(1000);
15             } catch (InterruptedException e) {
16                 e.printStackTrace();
17             }
18             System.out.println("size:"+li.size());
19         }
20     }
21 }

100个线程对list执行了100次add(),按理而size应该始终等于100,但实际却可能小于100。这就验证ArryList在多线程环境下不安全,将其变为线程安全的方法:List<String> list = Collections.synchronizedList(new ArrayList<String>())

 

      c.ArrayList实现了Serializable接口,因此它支持序列化,能够通过序列化传输,实现了RandomAccess接口,支持快速随机访问,实际上就是通过下标序号进行快速访问,实现了Cloneable接口,能被克隆。

 

二、ArrayList的实现

  1)私有属性

  

 

很明显,elementData是存放元素的,size是元素的数量,要特别注意elementData是加了transient关键字的。Java的serialization提供了一种持久化对象实例的机制。当持久化对象时,可能有一个特殊的对象数据成员,我们不想用serialization机制来保存它。为了在一个特定对象的一个域上关闭serialization,可以在这个域前加上关键字transient。

 

  2)Fail-Fast机制

ArrayList也采用了快速失败的机制,通过记录modCount参数来实现,在面对并发的修改时,迭代器很快就会完全失败,而不是冒着在将来某个不确定时间发生任意不确定行为的风险。具体介绍请参考。

 

总结:

关于ArrayList的源码,给出几点比较重要的总结:

    1、注意其三个不同的构造方法。无参构造方法构造的ArrayList的容量默认为10,带有Collection参数的构造方法,将Collection转化为数组赋给ArrayList的实现数组elementData。

    2、注意扩充容量的方法ensureCapacity。ArrayList在每次增加元素(可能是1个,也可能是一组)时,都要调用该方法来确保足够的容量。当容量不足以容纳当前的元素个数时,就设置新的容量为旧的容量的1.5倍加1,如果设置后的新容量还不够,则直接新容量设置为传入的参数(也就是所需的容量),而后用Arrays.copyof()方法将元素拷贝到新的数组(详见下面的第3点)。从中可以看出,当容量不够时,每次增加元素,都要将原来的元素拷贝到一个新的数组中,非常之耗时,也因此建议在事先能确定元素数量的情况下,才使用ArrayList,否则建议使用LinkedList。

    3、ArrayList的实现中大量地调用了Arrays.copyof()和System.arraycopy()方法。我们有必要对这两个方法的实现做下深入的了解。

首先来看Arrays.copyof()方法。它有很多个重载的方法,但实现思路都是一样的,我们来看泛型版本的源码:

1 public static <T> T[] copyOf(T[] original, int newLength) {  
2     return (T[]) copyOf(original, newLength, original.getClass());  
3 }

很明显调用了另一个copyof方法,该方法有三个参数,最后一个参数指明要转换的数据的类型,其源码如下:

 

1 public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {  
2     T[] copy = ((Object)newType == (Object)Object[].class)  
3         ? (T[]) new Object[newLength]  
4         : (T[]) Array.newInstance(newType.getComponentType(), newLength);  
5     System.arraycopy(original, 0, copy, 0,  
6                      Math.min(original.length, newLength));  
7     return copy;  
8 }

这里可以很明显地看出,该方法实际上是在其内部又创建了一个长度为newlength的数组,调用System.arraycopy()方法,将原来数组中的元素复制到了新的数组中。

下面来看System.arraycopy()方法。该方法被标记了native,调用了系统的C/C++代码,在JDK中是看不到的,但在openJDK中可以看到其源码。该函数实际上最终调用了C语言的memmove()函数,因此它可以保证同一个数组内元素的正确复制和移动,比一般的复制方法的实现效率要高很多,很适合用来批量处理数组。Java强烈推荐在复制大量数组元素时用该方法,以取得更高的效率。

 

  4、ArrayList基于数组实现,可以通过下标索引直接查找到指定位置的元素,因此查找效率高,但每次插入或删除元素,就要大量地移动元素,插入删除元素的效率低。

  5、在查找给定元素索引值等的方法中,源码都将该元素的值分为null和不为null两种情况处理,ArrayList中允许元素为null。

posted @ 2017-04-09 15:01  夏威夷8080  阅读(964)  评论(0编辑  收藏  举报