背诵 Java集合

1、Java中有哪些集合
Java中的集合类主要由 Collection 和 Map 这两个接口派生出
Collection接口又派生出三个子接口：Set、List、Queue
Set：HashSet、TreeSet
List：ArrayList、LinkedList、Vector
Queue：PriorityQueue、Deque
Map接口下的集合：HashMap、ConcurrentHashMap、Hashtable、TreeMap

2、List、Set、Map三者的区别
List：存储的元素有序、可重复
Set：存储的元素无序、不可重复
Map：存储键值对<Key,Value>；Key是无序的，不可重复；Value是无序的，可重复；每个键最多映射一个值，但同一个值可以被多个键映射

3、ArrayList和LinkedList的区别
（1）底层结构：ArrayList基于数组实现；LinkedList基于双向链表实现
（2）性能：对于随机访问，ArrayList要优于LinkedList；对于插入和删除操作，LinkedList要优于ArrayList，但LinkedList 比 ArrayList 更占内存；因为LinkedList的节点除了存储数据，还存储了两个引用，一个指向前一个元素，一个指向后一个元素

4、有哪些线程安全的List
Vector、
Collections.SynchronizedList：SynchronizedList是Collections的内部类，Collections提供了synchronizedList方法，可以将一个线程不安全的List包装成线程安全的List，即SynchronizedList
CopyOnWriteArrayList：COW机制（写时复制机制）
工作原理：它采用复制底层数组的方式来实现写操作；当线程对此类集合执行读取操作时，线程将会直接读取集合本身，无须加锁与阻塞；当线程对此类集合执行写入操作时，集合会在底层复制一份新的数组，接下来对新的数组执行写入操作；
由于对集合的写入操作都是对数组的副本执行操作，因此它是线程安全的；在所有线程安全的List中，它是性能最优的方案

5、ArrayList的扩容机制（基于jdk1.8）
（1）ArrayList以无参构造方法创建ArrayList时，初始化赋值的是一个空数组，对数组进行添加元素操作时，才真正分配容量；当向ArrayList中添加第一个元素时，数组容量默认扩容为10
（2）当需要扩容时，扩容都以原来容量的1.5倍；newSize= odlSize + oldSize>>1;
（3）最后，通过Arrays.copyOf()静态方法将原数组中的内容放到扩容后的新数组里面

6、HashMap底层实现
在JDK1.7时，HashMap的底层数据结构是：数组 + 链表
在JDK1.8时，HashMap的底层数据结构是：数组 + 链表 + 红黑树
put操作：
① 首先判断数组是否为空，如果数组为空则进行第一次扩容（resize）
② 根据key计算扰动的hash值并与（数组的长度-1）进行与操作，得到键值对在数组中的索引（int index = key.hashCode() & (length-1) ）
③ 如果该位置为null，则直接插入
④ 如果该位置不为null，则判断key是否“相同”（先hashCode()再equals() ），如果“相同”，则直接覆盖value
⑤ 如果key不一样，则判断该元素是否为红黑树的节点，如果是，则直接在红黑树中插入键值对
⑥ 如果不是红黑树的节点，则就是链表，遍历这个链表仍未找到该key，执行插入操作；如果遍历过程中若发现key已存在，直接覆盖value即可
如果链表的长度大于等于8且数组的大小大于64，则将链表转化为红黑树（先在链表中插入再进行判断），否则再次扩容
⑦ 插入成功后，判断容器中元素的个数（HashMap.size；键值对个数）是否>=阈值（容量 * 负载因子）（容量，capacity：HashMap中Entry数组长度，或者说是桶的数量），如果是，就进行扩容操作
扩容步骤：1、resize：创建一个新Entry数组，长度是原来数组的2倍；2、rehash：遍历老Entry数组，把里面的每一个元素取出来重新计算其在新数组的index，将元素存入新数组中

为什么负载因子设为0.75？查询效率与空间使用率的权衡

get操作：
① 计算 key 扰动后的 hash 值，找到 key 在数组中的位置（ index = hash&(length -1)）
② 如果该位置为null，就直接返回null
③ 否则，根据 equals() 判断 key 与当前位置的key是否相同，如果相同，直接返回其值
④ 如果不同，再判断当前元素是否为树节点，如果是树节点就按红黑树进行查找；否则，按照链表的方式进行查找

7、HashMap的扩容机制
（1）数组的初始容量为16，之后2倍扩容，一是为了提高性能使用足够大的数组，二是为了能使用位运算代替取模运算
（2）数组是否需要扩充是通过当前元素个数与数组容量*负载因子的大小关系判断
（3）>8且数组大小大于84 <6变回链表结构

8、HashMap为什么是线程不安全的
（1）头插法：在JDK1.7中，当并发执行扩容操作时会造成死循环 和 数据丢失的情况
（2）尾插法：在JDK1.8中，在并发执行put操作时会发生数据覆盖的情况

9、HashMap采用拉链发解决哈希冲突：即将同义词放在一个链表中

10、HashMap为什么使用红黑树而不是B-/B+树或平衡二叉树AVL或二叉查找树
二叉排序树在极端情况下会出现线性结构;如果用B/B+树的话，在数据量不是很多的情况下，数据都会"挤"在一个结点里面，这个时候遍历效率就退化成了链表；
平衡二叉树是严格平衡的树，在插入或删除后维持平衡的开销要大于红黑树

11、HashMap 和 Hashtable 的区别
① HashMap是⾮线程安全的；Hashtable是线程安全的，Hashtable 内部的⽅法基本都经过 synchronized 修饰
② 因为线程安全的问题，HashMap要⽐Hashtable效率⾼⼀点
③ HashMap允许键和值是null，而Hashtable不允许键或值是null；HashMap中，null可以作为键，这样的键只有⼀个，可以有⼀个或多个值为null；HashTable则不允许，当 put 进的键或值只要有⼀个 null，直接抛出 NullPointerException
④ HashMap默认的初始⼤⼩为16，之后每次扩充，容量变为原来的2倍；Hashtable默认的初始⼤⼩为11，之后每次扩充，容量变为原来的2n+1

12、ConcurrentHashMap
JDK1.7：底层数据结构：Segments数组 + HashEntry数组 + 链表，采用分段锁保证安全性，对Segments上锁，Segments继承自ReentrantLock
get()操作：HashEntry 中的 value属性和 next指针是用volatile修饰的，保证了可见性，所以每次获取的都是最新值，因此，get()过程不需要加锁
get()操作流程
1、将key传入get方法中，先根据key的 hash值找到对应的segment段
2、再根据segment中的get方法再次hash，找到HashEntry数组中的位置
3、最后在链表中根据hash值和equals()方法进行查找
put()操作流程：
1、将key传入put方法中，先根据 key的hash值找到对应的segment段
2、再根据segment中的put方法，对该段数据加锁lock()
3、再次hash定位，确定存放的hashEntry数组中的位置
4、在链表中根据hash值和equals方法进行比较，如果相同就直接覆盖，如果不同就插入在链表中

JDK1.8
底层数据结构：Node数组 + 链表 + 红黑树；采用 Synchronized 和 CAS 来保证线程安全

get()操作：
get操作全程无锁；get操作可以无锁是由于 Node元素的值val 和指针next 是用 volatile 修饰的，保证了可见性，所以每次获取的都是最新值
get()操作流程
1、计算hash值，定位到Node数组中的位置
2、如果该位置为null，则直接返回null
3、如果该位置不为null，再判断该节点是红黑树节点还是链表节点；如果是红黑树节点，使用红黑树的查找方式来进行查找；如果是链表节点，遍历链表进行查找

put()操作流程
1、先判断Node数组有没有初始化，如果没有初始化先初始化，执行initTable()方法
2、根据key的进行hash定位，找到Node数组中的位置，如果不存在hash冲突，即该位置是null，进行CAS插入
3、如果存在hash冲突，就先对链表的头节点或者红黑树的头节点加synchronized锁
4、如果是链表，就遍历链表，如果key相同就执行覆盖操作，如果不同就将元素插入到链表的尾部，并且在链表长度大于8，Node数组的长度超过64时，会将链表的转化为红黑树，否则扩容
5、如果是红黑树，就按照红黑树的结构进行插入

13、ConcurrentHashMap和Hashtable的区别
1、底层数据结构
JDK1.7的ConcurrentHashMap底层采用：Segments数组 + HashEntry数组 + 链表
JDK1.8的ConcurrentHashMap底层采用：Node数组 + 链表 + 红黑树
Hashtable底层数据结构采用：数组 + 链表
2、实现线程安全的方式
JDK1.7中ConcurrentHashMap采用 分段锁 实现线程安全
JDK1.8中ConcurrentHashMap采用 synchronized 和 CAS 来实现线程安全
Hashtable采用 synchronized 来实现线程安全；在方法上加synchronized同步锁

14、HashSet和TreeSet的异同
相同点：HashSet和TreeSet的元素都是不能重复的，都是线程不安全的

不同点
① HashSet中的元素可以为null，但TreeSet中的元素不能为null
② HashSet不能保证元素的排列顺序，TreeSet支持自然排序、定制排序两种排序方式
③ HashSet底层采用哈希表实现，TreeSet底层采用红黑树实现

posted @ 2022-03-17 07:51 紫薇哥哥阅读(62) 评论(0) 收藏举报

刷新页面返回顶部

紫薇哥哥

背诵 Java集合

公告