关于java集合类ArrayList的理解

一、 ArrayList概述：

　 a.ArrayList是基于数组实现的，是一个动态数组，其容量能自动增长，类似于C语言中的动态申请内存，动态增长内存。

　　为什么说ArrayList是基于数组实现的，看看jdk源码ArrayList的构造函数

　　所以准确的说，这个数组是一个Object数组。

　　还有一个带参数的构造函数，它是初始化时指定数组的大小。

　　那为什么说ArrayList容量能自动增长，容量Capacity是Java后引进的概念，以区别数组的Length。把私有数组预先实例化，然后通过copyOf方法覆盖原数组，是实现自动化改变ArrayList的大小（size)的关键。

　　上面这些都可以在源代码里找到，有三点需要说下

　　①虽然无参数的构造函数初始化的是空数组，但是后面会有判断 if (elementData == EMPTY_ELEMENTDATA) {minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity);}，所以默认还是10。

　　②通过copyOf方法覆盖原数组应该是这段代码elementData = Arrays.copyOf(elementData, newCapacity);

　　③每次add前如果发现容量不足，会自动扩容，新的容量是int newCapacity = oldCapacity + (oldCapacity >> 1);也就是原有容量的1.5倍。然后通过底层的复制方法（第②点）将原有数据复制过来。

　　综上得出结论：如果可预知数据量的多少，可在构造ArrayList时指定其容量。在添加大量元素前，应用程序也可以使用ensureCapacity操作来增加ArrayList实例的容量，这可以减少递增式再分配的数量。注意，此实现不是同步的。如果多个线程同时访问一个ArrayList实例，而其中至少一个线程从结构上修改了列表，那么它必须保持外部同步。

b.ArrayList不是线程安全的，只能用在单线程环境下，多线程环境下可以考虑用Collections.synchronizedList(List l)函数返回一个线程安全的ArrayList类，也可以使用concurrent并发包下的CopyOnWriteArrayList类。

　为什么说 ArrayList不是线程安全的？看看jdk里ArrayList的add方法是如何写的

　　问题就出在size++这边，主要分为两个步骤：

1）将add的元素放到size位置

2）将size加1

　　假设size=5.若线程A在5位置存放了值valueA，获得size=5,但还没来得及将size加1写入主存。此时线程B在也在5位置存放了值valueB,也获得size=5，而后A、B分别将size加1后写入主存，size=6，即两个线程执行两次add()后size只加了1。

　　下面写个程序验证：

 1 public class Run {
 2     static ArrayList<String> li = new ArrayList<String>();
 3     public static void main(String[] args) {
 4         for (int i = 0; i < 100; i++) {
 5             new Thread(new Runnable() {
 6                 @Override
 7                 public void run() {
 8                     li.add("");
 9                 }
10             }).start();
11         }
12         while (true) {
13             try {
14                 Thread.sleep(1000);
15             } catch (InterruptedException e) {
16                 e.printStackTrace();
17             }
18             System.out.println("size:"+li.size());
19         }
20     }
21 }

100个线程对list执行了100次add()，按理而size应该始终等于100，但实际却可能小于100。这就验证ArryList在多线程环境下不安全，将其变为线程安全的方法：List<String> list = Collections.synchronizedList(new ArrayList<String>())

c.ArrayList实现了Serializable接口，因此它支持序列化，能够通过序列化传输，实现了RandomAccess接口，支持快速随机访问，实际上就是通过下标序号进行快速访问，实现了Cloneable接口，能被克隆。

二、ArrayList的实现

　　1）私有属性

很明显，elementData是存放元素的，size是元素的数量，要特别注意elementData是加了transient关键字的。Java的serialization提供了一种持久化对象实例的机制。当持久化对象时，可能有一个特殊的对象数据成员，我们不想用serialization机制来保存它。为了在一个特定对象的一个域上关闭serialization，可以在这个域前加上关键字transient。

　　2）Fail-Fast机制

ArrayList也采用了快速失败的机制，通过记录modCount参数来实现，在面对并发的修改时，迭代器很快就会完全失败，而不是冒着在将来某个不确定时间发生任意不确定行为的风险。具体介绍请参考。

总结:

关于ArrayList的源码，给出几点比较重要的总结：

1、注意其三个不同的构造方法。无参构造方法构造的ArrayList的容量默认为10，带有Collection参数的构造方法，将Collection转化为数组赋给ArrayList的实现数组elementData。

2、注意扩充容量的方法ensureCapacity。ArrayList在每次增加元素（可能是1个，也可能是一组）时，都要调用该方法来确保足够的容量。当容量不足以容纳当前的元素个数时，就设置新的容量为旧的容量的1.5倍加1，如果设置后的新容量还不够，则直接新容量设置为传入的参数（也就是所需的容量），而后用Arrays.copyof()方法将元素拷贝到新的数组（详见下面的第3点）。从中可以看出，当容量不够时，每次增加元素，都要将原来的元素拷贝到一个新的数组中，非常之耗时，也因此建议在事先能确定元素数量的情况下，才使用ArrayList，否则建议使用LinkedList。

3、ArrayList的实现中大量地调用了Arrays.copyof()和System.arraycopy()方法。我们有必要对这两个方法的实现做下深入的了解。

首先来看Arrays.copyof()方法。它有很多个重载的方法，但实现思路都是一样的，我们来看泛型版本的源码：

1 public static <T> T[] copyOf(T[] original, int newLength) {  
2     return (T[]) copyOf(original, newLength, original.getClass());  
3 }

很明显调用了另一个copyof方法，该方法有三个参数，最后一个参数指明要转换的数据的类型，其源码如下：

1 public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {  
2     T[] copy = ((Object)newType == (Object)Object[].class)  
3         ? (T[]) new Object[newLength]  
4         : (T[]) Array.newInstance(newType.getComponentType(), newLength);  
5     System.arraycopy(original, 0, copy, 0,  
6                      Math.min(original.length, newLength));  
7     return copy;  
8 }

这里可以很明显地看出，该方法实际上是在其内部又创建了一个长度为newlength的数组，调用System.arraycopy()方法，将原来数组中的元素复制到了新的数组中。

下面来看System.arraycopy()方法。该方法被标记了native，调用了系统的C/C++代码，在JDK中是看不到的，但在openJDK中可以看到其源码。该函数实际上最终调用了C语言的memmove()函数，因此它可以保证同一个数组内元素的正确复制和移动，比一般的复制方法的实现效率要高很多，很适合用来批量处理数组。Java强烈推荐在复制大量数组元素时用该方法，以取得更高的效率。

　　4、ArrayList基于数组实现，可以通过下标索引直接查找到指定位置的元素，因此查找效率高，但每次插入或删除元素，就要大量地移动元素，插入删除元素的效率低。

　　5、在查找给定元素索引值等的方法中，源码都将该元素的值分为null和不为null两种情况处理，ArrayList中允许元素为null。

posted @ 2017-04-09 15:01 夏威夷8080 阅读(964) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

关于java集合类ArrayList的理解

公告