集合继承体系图的理解

一、Collection、Collections的区别？

　　1. java.util.Collection是一个集合的顶级接口。它提供了对集合对象进行基本操作的通用接口方法。Collection接口在Java类库中有很多具体的实现，其直接继承接口有List与Set。

　　2. Collections是集合类的一个工具类，其中提供了一系列静态方法，用于对集合中元素进行排序、搜索以及线程安全等操作。

　　　　1）排序（sort）：使用sort方法可以根据元素的自然顺序对指定列表按升序进行排序。列表中的所有元素都必须实现Comparable接口。此列表内的所有元素都必须是使用指定比较器可相互比较的。

 1 List<Integer> list = new ArrayList<Integer>();
 2         int array[] = {112, 111, 23, 456, 231 };
 3         for (int i = 0; i < array.length; i++) {
 4             list.add(array[i]);
 5         }
 6         Collections.sort(list);
 7         for (int i = 0; i < array.length; i++) {
 8             System.out.println(list.get(i));
 9         }
10 结果：23  111  112  231  456

　　　　2）混排（shuffling）：混排算法所做的正好与sort相反，它打乱在一个List中可能有的任何排列的踪迹。也就是说，基于随机源的输入重排该list，这样的排列具有相同的可能性（假设随机源是公正的）。这个算法在实现一个碰运气的游戏中是非常有用的。例如，它可被用来混派代表一副牌的card对象的一个list。另外，在生成测试案例时，它也是十分有用的。

　　　　3）反转（reverse）：使用reverse方法可以根据元素的自然顺序对指定列表按降序进行排序。Collections.reverse(list)

　　　　4）替换所有的元素（fill）：使用指定元素替换指定列表中的所有元素。Collections.fill(li,"aaa");

　　　　5）拷贝（copy）：用两个参数，一个目标list和一个源list，将源的元素拷贝到目标，并覆盖它的内容。目标list至少与源一样长。如果它更长，则在目标list中的剩余元素不受影响。

　　　　　　Collections.copy(list,li)：前面一个参数是目标列表，后一个是源列表

　　　　6）返回Collections中的最小元素（min）：根据指定比较器产生的顺序，返回给定collection的最小元素。collection中的所有元素都必须是通过指定比较器可相互比较的。

　　　　　　Collections.min(list)

　　　　7）返回Collections中的最大元素（max）：根据指定比较器产生的顺序，返回给顶collection的最大元素。Collections.max(list)

　　　　8）lastIndexOfSubList：返回值定源列表中最后一次出现指定目标列表的起始位置。 int count = Collections.lastIndexOfSubList(list,li);

　　　　9）Rotate：根据指定的距离循环移动指定列表中的元素。　　Collections.rotate(list,-1); //如果是负数，则正向移动，正数则反向移动。

二、List、Set的区别？

List与Set都继承于Collection，Collection是集合的顶级接口；

　　List为有序可重复的集合接口，ArrayList、LinkedList、Vector为其实现类；

　　Set是无序不重复的集合接口，HashSet、LinkedHashSet、TreeSet为其实现类。

　　　　取出元素的方法只有迭代器。不可以存放重复元素，元素存取是无序的。因此存入Set中的每个对象都必须重写equals()和hashCode()方法来确保对象的唯一性。

三、ArrayList、LinkedList、Vector的区别和实现原理?

　　ArrayList和Vector只能按顺序存储元素（从下标为0的位置开始），删除元素的时候，需要移位并置空，默认初始化容量都是10。

　　ArrayList和Vector基于数组实现的，LinkedList基于双向循环链表实现的（含有头结点）。

1、线程安全性

　　ArrayList不具有线程安全性，用在单线程环境中。LinkedList也是线程不安全的，如果在并发环境下使用它们，可以用Colletions类中的静态方法synchronizedList()对ArrayList和LinkedList进行调用即可。

　　Vector是线程安全的，即它的大部分方法都包含关键字synchronized。Vector的效率没有ArrayList和LinkedList高。

2、扩容机制

　　从内部实现机制来讲，ArrayList和Vector都是使用Object的数组形式来存储的。当你向这两种类型中增加元素的时候，若容量不够，需要进行扩容。ArrayList扩容后的容量是之前的1.5倍，然后，把之前的数据拷贝到新建的数组。Vector默认情况下扩容后的容量是之前的2倍。

　　Vector可以设置容量增量，而ArrayList不可以。在Vector中有capacityIncrement：向量的大小大于其容量时，容量自动增加的量。如果在创建Vector时，指定了capacityIncrement的大小；则每次当Vector中动态数组容量需要增加时，如果容量的增量大于零，增加的大小都是capacityIncrement。如果容量的增量小于等于零，则每次需要增大容量时，向量的容量将增大为之前的2倍。

　　可变长度数组的原理：当元素个数超过数组的长度时，会产生一个新数组，将原数组的数据复制到新数组，再将新的元素添加到新数组中。

3、增删改查的效率

　　ArrayList和Vector中，从指定的位置（用index）检索一个对象，或在集合的末尾插入、删除一个对象的时间是一样的，可表示为O(1)。但是，如果在集合的其他位置增加或删除元素那么花费的时间是O(N)。LinkedList中，在插入、删除集合中任何位置的元素所花费的时间都是一样的—O(1)。但它在索引一个元素的时候比较慢，为O(N)。

　　所以，如果只是查找特定位置的元素或只在集合的末端增加、移除元素，那么使用Vector或ArrayList都可以。如果是对其他指定位置的插入、删除操作，最好选择LinkedList。

四、HashMap、HashTable

　　1、HashTable是线程安全的，方法是synchronized的，适合在多线程环境中使用，效率稍低；HashMap是线程不安全的，方法不是synchronized的，效率稍高，适合在单线程环境下使用，所以在多线程场合下使用的话，需要手动同步HashMap，Collections.sychronizedMap()。

　　HashTable的效率比较低的原因？

　　　　在线程竞争激烈的情况下HashTable的效率非常低下。因为当一个线程访问HashTable的同步方法时，访问其他同步方法的线程就可能进入阻塞或者轮询状态。如线程1使用PUT进行添加元素，线程2不但不能使用PUT方法添加元素，并且也不能使用GET方法来获取元素，所以竞争越激烈效率越低。

　　2、HashMap的key和value都可以为null值，HashTable的key和value都不允许有null值。

　　3、HashMap中的数组的默认大小是16，而且一定是2的倍数，扩容后的数组长度是之前数组长度的2倍。HashTable中数组的默认大小为11，扩容后数组长度是之前数组长度的2倍+1。

　　4、哈希值的使用不同。

　　　　HashMap重新计算hash值，而且用&代替求模：

 1 int hash = hash(key.hashcode());
 2 int i = indexFor(hash,table.length);
 3 static int hash(Object x){
 4     int h = x.hashCode();
 5     h+=~(h<<9);
 6     h^=(h>>>14);
 7     h+=(h<<4);
 8     h^=(h>>>10);
 9     return h;
10 }
11 static int indexFor(int h,int length){
12     return h&(length-1);//hashmap的表长永远是2^n
13 }

　　　　HashTable直接使用对象的hashCode值：

1 int hash = key.hashCode();
2 int index = (hash&&0x7FFFFFFF)

　　5、判断是否含有某个键

　　在HashMap中，null可以作为键，这样的键只有一个；可以有一个或多个键所对应的值为null。当get()方法返回null值时，既可以表示HashMap中没有该键，也可以表示该键所对应的值为null。因此，在HashMap中不能用get()方法来判断HashMap中是否存在某个键，而应该用ContainsKey()方法来判断。Hashtable的键值都不能为null，所以可以用get()方法来判断是否含有某个键。

五、HashSet

　　哈希表存放的是哈希值。hashset存储元素的顺序并不是按照存入时的顺序（和list显然不同）而是按照哈希值来存的所以取数也是按照哈希值取得。元素的哈希值是通过元素的hashcode方法来获取的，hashset首先判断两个元素的哈希值，如果哈希值一样，接着会比较equals方法，如果equals结果为true，hashset就视为同一个元素。如果equals为false就不是同一个元素。

　　哈希值相同equals为false的元素是怎么存储呢？就是在同样的哈希值下顺延（可以认为哈希值相同的元素放在一个哈希桶中），也就是哈希一样的存一列。

六、TreeSet

　　1、treeset是使用二叉树的原理对add的对象按照指定的顺序排序，每增加一个对象都会进行排序，将对象插入到二叉树指定的位置；

　　2、Integer和String对象都可以进行默认的treeset排序，而自定义的对象是不可以的，自己定义的类必须实现Comparable接口，并且覆盖相应的compareTo()函数，才可以正常使用。

　　3、在重写compareTo()函数时，要返回相应的值才能使treeset按照一定的规则进行排序。

　　4、比较此对象与指定对象顺序，如果该对象小于、等于或大与指定对象，则分别返回负整数、零或正整数。

七、TreeMap（可排序）

　　treeMap实现SortedMap接口，能够把它保存的记录根据键排序，默认是按键值的升序排序，也可以指定排序的比较器，当用iterator遍历treeMap时，得到的记录是排过序的。

　　如果使用排序的映射，建议使用treeMap。

　　在使用treeMap时，key必须实现Comparable接口或在构造treeMap传入自定义的Comparator，否则会在运行时抛出java.lang.ClassCastException类型的异常。

八、LinkedHashMap（记录插入顺序)

　　LinkedHashMap是hashMap的一个子类，保存了记录的插入顺序，在用iterator遍历LinkedHashMap时，先得到的记录肯定是先插入的，也可以在构造函数时带参数，按照访问次序排序。

九、Map接口与Collection接口的区别？

　　Map是双列的，Collection是单列的；

　　Map的键值唯一，Collection的子接口set是唯一的；

　　Map的数据结构只针对键有效，Collection针对元素有效；

集合	初始容量	扩容因子	负载因子	底层结构	线程是否安全
ArrayList	10	1.5	无（满了扩容）	数组	否
Vector	10	2	无（满了扩容）	数组	是
HashMap	16	2	0.75	数组+链表+红黑树	否
HashSet	16	2	0.75	数组+链表+红黑树	否
HashTable	11	2*1+1	0.75	数组+链表	是

posted @ 2019-11-09 12:34 MrHH 阅读(1193) 评论(0) 收藏举报

刷新页面返回顶部

MrHH

集合继承体系图的理解

公告