集合继承体系图的理解

       

一、Collection、Collections的区别?

  1. java.util.Collection是一个集合的顶级接口。它提供了对集合对象进行基本操作的通用接口方法。Collection接口在Java类库中有很多具体的实现,其直接继承接口有List与Set。

  2. Collections是集合类的一个工具类,其中提供了一系列静态方法,用于对集合中元素进行排序、搜索以及线程安全等操作。

    1)排序(sort):使用sort方法可以根据元素的自然顺序对指定列表按升序进行排序。列表中的所有元素都必须实现Comparable接口。此列表内的所有元素都必须是使用指定比较器可相互比较的。

 1 List<Integer> list = new ArrayList<Integer>();
 2         int array[] = {112, 111, 23, 456, 231 };
 3         for (int i = 0; i < array.length; i++) {
 4             list.add(array[i]);
 5         }
 6         Collections.sort(list);
 7         for (int i = 0; i < array.length; i++) {
 8             System.out.println(list.get(i));
 9         }
10 结果:23  111  112  231  456

    2)混排(shuffling):混排算法所做的正好与sort相反,它打乱在一个List中可能有的任何排列的踪迹。也就是说,基于随机源的输入重排该list,这样的排列具有相同的可能性(假设随机源是公正的)。这个算法在实现一个碰运气的游戏中是非常有用的。例如,它可被用来混派代表一副牌的card对象的一个list。另外,在生成测试案例时,它也是十分有用的。

    3)反转(reverse):使用reverse方法可以根据元素的自然顺序对指定列表按降序进行排序。Collections.reverse(list)

    4)替换所有的元素(fill):使用指定元素替换指定列表中的所有元素。Collections.fill(li,"aaa");

    5)拷贝(copy):用两个参数,一个目标list和一个源list,将源的元素拷贝到目标,并覆盖它的内容。目标list至少与源一样长。如果它更长,则在目标list中的剩余元素不受影响。

      Collections.copy(list,li):前面一个参数是目标列表,后一个是源列表

    6)返回Collections中的最小元素(min):根据指定比较器产生的顺序,返回给定collection的最小元素。collection中的所有元素都必须是通过指定比较器可相互比较的。

      Collections.min(list)

    7)返回Collections中的最大元素(max):根据指定比较器产生的顺序,返回给顶collection的最大元素。Collections.max(list)

    8)lastIndexOfSubList:返回值定源列表中最后一次出现指定目标列表的起始位置。 int count = Collections.lastIndexOfSubList(list,li);

    9)Rotate:根据指定的距离循环移动指定列表中的元素。  Collections.rotate(list,-1); //如果是负数,则正向移动,正数则反向移动。

二、List、Set的区别?

List与Set都继承于Collection,Collection是集合的顶级接口;

  List为有序可重复的集合接口,ArrayList、LinkedList、Vector为其实现类;

  Set是无序不重复的集合接口,HashSet、LinkedHashSet、TreeSet为其实现类。

    取出元素的方法只有迭代器。不可以存放重复元素,元素存取是无序的。因此存入Set中的每个对象都必须重写equals()和hashCode()方法来确保对象的唯一性。

三、ArrayList、LinkedList、Vector的区别和实现原理?

  ArrayList和Vector只能按顺序存储元素(从下标为0的位置开始),删除元素的时候,需要移位并置空,默认初始化容量都是10。

  ArrayList和Vector基于数组实现的,LinkedList基于双向循环链表实现的(含有头结点)。

1、线程安全性

  ArrayList不具有线程安全性,用在单线程环境中。LinkedList也是线程不安全的,如果在并发环境下使用它们,可以用Colletions类中的静态方法synchronizedList()对ArrayList和LinkedList进行调用即可。

  Vector是线程安全的,即它的大部分方法都包含关键字synchronized。Vector的效率没有ArrayList和LinkedList高。

2、扩容机制

  从内部实现机制来讲,ArrayList和Vector都是使用Object的数组形式来存储的。当你向这两种类型中增加元素的时候,若容量不够,需要进行扩容。ArrayList扩容后的容量是之前的1.5倍,然后,把之前的数据拷贝到新建的数组。Vector默认情况下扩容后的容量是之前的2倍。

  Vector可以设置容量增量,而ArrayList不可以。在Vector中有capacityIncrement:向量的大小大于其容量时,容量自动增加的量。如果在创建Vector时,指定了capacityIncrement的大小;则每次当Vector中动态数组容量需要增加时,如果容量的增量大于零,增加的大小都是capacityIncrement。如果容量的增量小于等于零,则每次需要增大容量时,向量的容量将增大为之前的2倍。

  可变长度数组的原理:当元素个数超过数组的长度时,会产生一个新数组,将原数组的数据复制到新数组,再将新的元素添加到新数组中。

3、增删改查的效率

  ArrayList和Vector中,从指定的位置(用index)检索一个对象,或在集合的末尾插入、删除一个对象的时间是一样的,可表示为O(1)。但是,如果在集合的其他位置增加或删除元素那么花费的时间是O(N)。LinkedList中,在插入、删除集合中任何位置的元素所花费的时间都是一样的—O(1)。但它在索引一个元素的时候比较慢,为O(N)。

  所以,如果只是查找特定位置的元素或只在集合的末端增加、移除元素,那么使用Vector或ArrayList都可以。如果是对其他指定位置的插入、删除操作,最好选择LinkedList。

四、HashMap、HashTable

  1、HashTable是线程安全的,方法是synchronized的,适合在多线程环境中使用,效率稍低;HashMap是线程不安全的,方法不是synchronized的,效率稍高,适合在单线程环境下使用,所以在多线程场合下使用的话,需要手动同步HashMap,Collections.sychronizedMap()。

  HashTable的效率比较低的原因?

    在线程竞争激烈的情况下HashTable的效率非常低下。因为当一个线程访问HashTable的同步方法时,访问其他同步方法的线程就可能进入阻塞或者轮询状态。如线程1使用PUT进行添加元素,线程2不但不能使用PUT方法添加元素,并且也不能使用GET方法来获取元素,所以竞争越激烈效率越低。

  2、HashMap的key和value都可以为null值,HashTable的key和value都不允许有null值。

  3、HashMap中的数组的默认大小是16,而且一定是2的倍数,扩容后的数组长度是之前数组长度的2倍。HashTable中数组的默认大小为11,扩容后数组长度是之前数组长度的2倍+1。

  4、哈希值的使用不同。

    HashMap重新计算hash值,而且用&代替求模:

 1 int hash = hash(key.hashcode());
 2 int i = indexFor(hash,table.length);
 3 static int hash(Object x){
 4     int h = x.hashCode();
 5     h+=~(h<<9);
 6     h^=(h>>>14);
 7     h+=(h<<4);
 8     h^=(h>>>10);
 9     return h;
10 }
11 static int indexFor(int h,int length){
12     return h&(length-1);//hashmap的表长永远是2^n
13 }

    HashTable直接使用对象的hashCode值:

1 int hash = key.hashCode();
2 int index = (hash&&0x7FFFFFFF)

  5、判断是否含有某个键

  在HashMap中,null可以作为键,这样的键只有一个;可以有一个或多个键所对应的值为null。当get()方法返回null值时,既可以表示HashMap中没有该键,也可以表示该键所对应的值为null。因此,在HashMap中不能用get()方法来判断HashMap中是否存在某个键,而应该用ContainsKey()方法来判断。Hashtable的键值都不能为null,所以可以用get()方法来判断是否含有某个键。

五、HashSet

  哈希表存放的是哈希值。hashset存储元素的顺序并不是按照存入时的顺序(和list显然不同)而是按照哈希值来存的所以取数也是按照哈希值取得。元素的哈希值是通过元素的hashcode方法来获取的,hashset首先判断两个元素的哈希值,如果哈希值一样,接着会比较equals方法,如果equals结果为true,hashset就视为同一个元素。如果equals为false就不是同一个元素。

  哈希值相同equals为false的元素是怎么存储呢?就是在同样的哈希值下顺延(可以认为哈希值相同的元素放在一个哈希桶中),也就是哈希一样的存一列。

六、TreeSet

  1、treeset是使用二叉树的原理对add的对象按照指定的顺序排序,每增加一个对象都会进行排序,将对象插入到二叉树指定的位置;

  2、Integer和String对象都可以进行默认的treeset排序,而自定义的对象是不可以的,自己定义的类必须实现Comparable接口,并且覆盖相应的compareTo()函数,才可以正常使用。

  3、在重写compareTo()函数时,要返回相应的值才能使treeset按照一定的规则进行排序。

  4、比较此对象与指定对象顺序,如果该对象小于、等于或大与指定对象,则分别返回负整数、零或正整数。

七、TreeMap(可排序)

  treeMap实现SortedMap接口,能够把它保存的记录根据键排序,默认是按键值的升序排序,也可以指定排序的比较器,当用iterator遍历treeMap时,得到的记录是排过序的。

  如果使用排序的映射,建议使用treeMap。

  在使用treeMap时,key必须实现Comparable接口或在构造treeMap传入自定义的Comparator,否则会在运行时抛出java.lang.ClassCastException类型的异常。

八、LinkedHashMap(记录插入顺序)

  LinkedHashMap是hashMap的一个子类,保存了记录的插入顺序,在用iterator遍历LinkedHashMap时,先得到的记录肯定是先插入的,也可以在构造函数时带参数,按照访问次序排序。

九、Map接口与Collection接口的区别?

  Map是双列的,Collection是单列的;

  Map的键值唯一,Collection的子接口set是唯一的;

  Map的数据结构只针对键有效,Collection针对元素有效;

集合 初始容量 扩容因子 负载因子 底层结构 线程是否安全
ArrayList 10 1.5 无(满了扩容) 数组
Vector 10 2 无(满了扩容) 数组
HashMap 16 2 0.75 数组+链表+红黑树
HashSet 16 2 0.75 数组+链表+红黑树
HashTable 11 2*1+1 0.75 数组+链表

 

 

 

 

 

 

posted @ 2019-11-09 12:34  MrHH  阅读(1085)  评论(0编辑  收藏  举报