背诵 Java集合

1、Java中有哪些集合
Java中的集合类主要由 Collection 和 Map 这两个接口派生出
Collection接口又派生出三个子接口:Set、List、Queue
Set:HashSet、TreeSet
List:ArrayList、LinkedList、Vector
Queue:PriorityQueue、Deque
Map接口下的集合:HashMap、ConcurrentHashMap、Hashtable、TreeMap

2、List、Set、Map三者的区别
List:存储的元素有序、可重复
Set:存储的元素无序、不可重复
Map:存储 键值对<Key,Value>;Key是无序的,不可重复;Value是无序的,可重复;每个键最多映射一个值,但同一个值可以被多个键映射

3、ArrayList和LinkedList的区别
(1)底层结构:ArrayList基于 数组 实现;LinkedList基于 双向链表 实现
(2)性能:对于随机访问,ArrayList要优于LinkedList;对于插入和删除操作,LinkedList要优于ArrayList,但LinkedList 比 ArrayList 更占内存;因为LinkedList的节点除了存储数据,还存储了两个引用,一个指向前一个元素,一个指向后一个元素

4、有哪些线程安全的List
Vector、
Collections.SynchronizedList:SynchronizedList是Collections的内部类,Collections提供了synchronizedList方法,可以将一个线程不安全的List包装成线程安全的List,即SynchronizedList
CopyOnWriteArrayList:COW机制(写时复制机制)
工作原理:它采用复制底层数组的方式来实现写操作;当线程对此类集合执行读取操作时,线程将会直接读取集合本身,无须加锁与阻塞;当线程对此类集合执行写入操作时,集合会在底层复制一份新的数组,接下来对新的数组执行写入操作;
由于对集合的写入操作都是对数组的副本执行操作,因此它是线程安全的;在所有线程安全的List中,它是性能最优的方案

5、ArrayList的扩容机制(基于jdk1.8)
(1)ArrayList以无参构造方法创建ArrayList时,初始化赋值的是一个空数组,对数组进行添加元素操作时,才真正分配容量;当向ArrayList中添加第一个元素时,数组容量默认扩容为10
(2)当需要扩容时,扩容都以原来容量的1.5倍;newSize= odlSize + oldSize>>1;
(3)最后,通过Arrays.copyOf()静态方法将原数组中的内容放到扩容后的新数组里面

6、HashMap底层实现
在JDK1.7时,HashMap的底层数据结构是:数组 + 链表
在JDK1.8时,HashMap的底层数据结构是:数组 + 链表 + 红黑树
put操作:
① 首先判断数组是否为空,如果数组为空则进行第一次扩容(resize)
② 根据key计算扰动的hash值并与(数组的长度-1)进行与操作,得到键值对在数组中的索引(int index = key.hashCode() & (length-1) )
③ 如果该位置为null,则直接插入
④ 如果该位置不为null,则判断key是否“相同”( 先hashCode()再equals() ),如果“相同”,则直接覆盖value
⑤ 如果key不一样,则判断该元素是否为红黑树的节点,如果是,则直接在红黑树中插入键值对
⑥ 如果不是红黑树的节点,则就是链表,遍历这个链表仍未找到该key,执行插入操作;如果遍历过程中若发现key已存在,直接覆盖value即可
如果链表的长度大于等于8且数组的大小 大于64,则将链表转化为红黑树(先在链表中插入再进行判断),否则再次扩容
⑦ 插入成功后,判断容器中元素的个数(HashMap.size;键值对个数)是否>=阈值(容量 * 负载因子)(容量,capacity:HashMap中Entry数组长度,或者说是 桶的数量),如果是,就进行扩容操作
扩容步骤:1、resize:创建一个新Entry数组,长度是原来数组的2倍;2、rehash:遍历老Entry数组,把里面的每一个元素取出来重新计算其在新数组的index,将元素存入新数组中

为什么负载因子设为0.75? 查询效率与空间使用率的权衡

get操作:
① 计算 key 扰动后的 hash 值,找到 key 在数组中的位置( index = hash&(length -1))
② 如果该位置为null,就直接返回null
③ 否则,根据 equals() 判断 key 与当前位置的key是否相同,如果相同,直接返回其值
④ 如果不同,再判断当前元素是否为树节点,如果是树节点就按红黑树进行查找;否则,按照链表的方式进行查找

7、HashMap的扩容机制
(1)数组的初始容量为16,之后2倍扩容,一是为了提高性能使用足够大的数组,二是为了能使用位运算代替取模运算
(2)数组是否需要扩充是通过 当前元素个数 与 数组容量*负载因子 的大小关系 判断
(3)>8且数组大小大于84 <6变回链表结构

8、HashMap为什么是线程不安全的
(1)头插法:在JDK1.7中,当并发执行扩容操作时会造成死循环数据丢失的情况
(2)尾插法:在JDK1.8中,在并发执行put操作时会发生数据覆盖的情况

9、HashMap采用拉链发解决哈希冲突:即将同义词放在一个链表中

10、HashMap为什么使用红黑树而不是B-/B+树或平衡二叉树AVL或二叉查找树
二叉排序树在极端情况下会出现线性结构;如果用B/B+树的话,在数据量不是很多的情况下,数据都会"挤"在一个结点里面,这个时候遍历效率就退化成了链表;
平衡二叉树是严格平衡的树,在插入或删除后维持平衡的开销要大于红黑树

11、HashMap 和 Hashtable 的区别
① HashMap是⾮线程安全的;Hashtable是线程安全的,Hashtable 内部的⽅法基本都经过 synchronized 修饰
② 因为线程安全的问题,HashMap要⽐Hashtable效率⾼⼀点
③ HashMap允许键和值是null,而Hashtable不允许键或值是null;HashMap中,null可以作为键,这样的键只有⼀个,可以有⼀个或多个值为null;HashTable则不允许,当 put 进的键或值只要有⼀个 null,直接抛出 NullPointerException
④ HashMap默认的初始⼤⼩为16,之后每次扩充,容量变为原来的2倍;Hashtable默认的初始⼤⼩为11,之后每次扩充,容量变为原来的2n+1

12、ConcurrentHashMap
JDK1.7:底层数据结构:Segments数组 + HashEntry数组 + 链表,采用分段锁保证安全性,对Segments上锁,Segments继承自ReentrantLock
get()操作:HashEntry 中的 value属性 和 next指针 是用volatile修饰的,保证了可见性,所以每次获取的都是最新值,因此,get()过程不需要加锁
get()操作流程
1、将key传入get方法中,先根据key的 hash值 找到对应的segment段
2、再根据segment中的get方法再次hash,找到HashEntry数组中的位置
3、最后在链表中根据hash值和equals()方法进行查找
put()操作流程:
1、将key传入put方法中,先根据 key的hash值 找到对应的segment段
2、再根据segment中的put方法,对该段数据加锁lock()
3、再次hash定位,确定存放的hashEntry数组中的位置
4、在链表中根据hash值和equals方法进行比较,如果相同就直接覆盖,如果不同就插入在链表中

JDK1.8
底层数据结构:Node数组 + 链表 + 红黑树;采用 Synchronized 和 CAS 来保证线程安全

get()操作:
get操作全程无锁;get操作可以无锁是由于 Node元素的值val 和 指针next 是用 volatile 修饰的,保证了可见性,所以每次获取的都是最新值
get()操作流程
1、计算hash值,定位到Node数组中的位置
2、如果该位置为null,则直接返回null
3、如果该位置不为null,再判断该节点是红黑树节点还是链表节点;如果是红黑树节点,使用红黑树的查找方式来进行查找;如果是链表节点,遍历链表进行查找

put()操作流程
1、先判断Node数组有没有初始化,如果没有初始化先初始化,执行initTable()方法
2、根据key的进行hash定位,找到Node数组中的位置,如果不存在hash冲突,即该位置是null,进行CAS插入
3、如果存在hash冲突,就先对链表的头节点或者红黑树的头节点加synchronized锁
4、如果是链表,就遍历链表,如果key相同就执行覆盖操作,如果不同就将元素插入到链表的尾部,并且在链表长度大于8,Node数组的长度超过64时,会将链表的转化为红黑树,否则扩容
5、如果是红黑树,就按照红黑树的结构进行插入

13、ConcurrentHashMap和Hashtable的区别
1、底层数据结构
JDK1.7的ConcurrentHashMap底层采用:Segments数组 + HashEntry数组 + 链表
JDK1.8的ConcurrentHashMap底层采用:Node数组 + 链表 + 红黑树
Hashtable底层数据结构采用:数组 + 链表
2、实现线程安全的方式
JDK1.7中ConcurrentHashMap采用 分段锁 实现线程安全
JDK1.8中ConcurrentHashMap采用 synchronized 和 CAS 来实现线程安全
Hashtable采用 synchronized 来实现线程安全;在方法上加synchronized同步锁

14、HashSet和TreeSet的异同
相同点:HashSet和TreeSet的元素都是不能重复的,都是线程不安全的

不同点
① HashSet中的元素可以为null,但TreeSet中的元素不能为null
② HashSet不能保证元素的排列顺序,TreeSet支持自然排序、定制排序两种排序方式
③ HashSet底层采用哈希表实现,TreeSet底层采用红黑树实现

posted @ 2022-03-17 07:51  紫薇哥哥  阅读(57)  评论(0)    收藏  举报