ArrayList 最细致的解析笔记

ArrayList是一个类,这个类有一个数组参数elementData,ArrayList集合中的元素正是保存在这个数组中,它继承了数组查询的高性能,参考第3篇。ArrayList还封装了很多方法,便于对数组中的数据进行操作处理,其中就包括上一篇说的扩容,建议先理解第3篇数组。

 

扩容原理

 

在eclipse中调试以下代码,如下设置四个断点,打开调试视图。

 

public static void main(String[] args) {
       List list = new ArrayList();
       System.out.println("断点1");
       list.add(1);
       System.out.println("断点2");
       list.add(2);
       list.add(3);
       list.add(4);
       list.add(5);
       list.add(6);
       list.add(7);
       list.add(8);
       list.add(9);
       list.add(10);
       System.out.println("断点3");
       list.add(11);
       System.out.println("断点4");
   }

 

断点1:list的数组参数elementData的值为Object[0],表示数组初始长度为0。

 

 

断点2:在集合中添加了第一个元素,elementData数组长度变成了10。即初始扩容长度为10。

 

 

断点3:在集合中一共添加了10个元素,elementData长度仍然为10,此时无需扩容。

 

 

断点4:添加第11个元素,即超出了原数组长度。elementData长度扩容为15,即第二次以后的扩容,长度为原长度的1.5倍。

 

 

注意看图,elementData在断点1时标识是29,在断点2和断点3处的标识都是31,而在断点4时标识46,这说明elementData引用变量前后一共指向了三个不同的数组对象。也就是说,elementData并没有真正的扩容,而是创建了一个容量更大的数组对象来替代之前的数组,并且复制之前的数组内容。

 

元素类型Object

 

第3篇讲过,数组元素的长度必须是一致的。而以上代码中,我添加的都是int类型数据。假如我添加一个long型数据,如下,也是可以的。而int(4字节 )和long(8字节 )的长度是不一样的,这是为什么?

 

list.add(1);
list.add(1l);

 

假如声明时使用List,就指定了固定元素类型。而我的代码中并没有使用泛型,所以它的类型可以是任意Object,但不能是基本类型。当添加int元素时,会自动转换为Integer。当添加long元素时,会自动转换为Long。因此,最终list所有的元素类型都是引用类型(4字节),长度相同,这是实现数组高性能查询所必需的。以后讲其他集合的元素类型时,也和ArrayList是一样的原理,不再解释。

 

在尾部添加

 

第3篇在数组中添加了5亿个元素,很快就执行完成。假如用同样的方法在ArrayList中添加5亿元素会怎么样?

 

int size=500000000;
List list = new ArrayList();
long t1 = System.currentTimeMillis();
for(int i=0;i<size;i++){
   list.add(i);
}
long t2 = System.currentTimeMillis();
System.out.println(t2-t1);

 

运行结果:内存溢出

 

一直运行了n分钟没有结果,最终报错内存溢出。因为在这个过程中,会不断的扩容,不断的创建新数组对象,最终把内存撑爆。要解决这个问题,可以在创建ArrayList时传入一个int参数,根据参数值会直接初始一个较大的数组,就不用再频繁的扩容了。注意:如果初始数组太大又不使用,也会让费内存空间。修改代码,将new ArrayList()改成new ArrayList(size)

 

List list = new ArrayList(size);

 

只是这样做还不够,因为上面说了,list.add(i)实际上是创建了5亿个对象,数据量太大内存仍然不足。再次修改添加代码,将list.add(i)改成list.add(1),1会转换成new Integer(1),5亿个new Integer(1)仍然是5亿个对象。但是java对一些对象做了缓存,其中包括new Integer(0至127),以后会讲。现在只需知道,i改成1后只会有一个new Integer(1)对象,而不会创建5亿个对象。之后文章都会使用1作为集合参数,不再解释。修改代码如下 ,再次运行

 

list.add(1);

 

耗时:1080毫秒

 

add()方法默认是在尾部添加数据,ArrayList的size可以帮助数组瞬间完成定位,然后直接添加,所以这样的性能是很高的。

 

 

在指定位置添加

 

list.add(int index,E element)方法是在位置index处添加,如下

 

int size=500000000;
List list = new ArrayList(size);
long t1 = System.currentTimeMillis();
   for(int i=0;i<size;i++){
           list.add(0,1);
   }
long t2 = System.currentTimeMillis();www.gendan5.com
System.out.println(t2-t1);

 

耗时:无限

 

 

上图可以看出,向指定位置0插入元素时,其后面的所有元素都要一个个的向后移动,即每添加一个元素要移动n次元素。虽然没有创建对象,不会内存溢出,但是时间性能实在太低。

 

删除的性能

 

和添加同理,在尾部删除性能很高。但在指定位置删除也存在性能问题,需要把后面元素一个一个的往前移。

 

 

特性

 

  • 有序列表:集合中的元素按照添加顺序排列,先添加进集合的排在前面,后添加的排在后面。

  • 底层就是数组:操作尾部数据时,其性能是最高的。操作越靠前的数据,性能越低。

  • 封装了数组:操作更简便,代码可读性更高。但是也封装了额外操作,比如安全检查,数组是否越界等,这也带来一些性能开销,所以ArrayList性能会比数组稍稍低那么一点点。

 

应用场景

 

做普通项目时,对性能没有那么严格的要求,如果想要快速开发,使用封装过的ArrayList是第一选择。

 

关于从指定位置添加和删除,是ArrayList的性能缺陷。我们要做的是将其优点发挥到其擅长的场景,将其不擅长的场景交给其他数据结构来处理,扬长避短。后续要介绍的集合都是一样,没有哪一种结构是完美的,只有其最适合哪种场景。  

 

posted @ 2019-09-18 10:25  阿丘不秋  阅读(181)  评论(0编辑  收藏  举报