集合

集合框架的概述

  1. 集合、数组都是对多个数据进行存储的结构,简称Java容器(此处的存储不牵扯持久化存储(文件等))
  2. 数组在存储多个数据方面的特点:

一旦初始化以后,其长度就确定了。
数组一旦定义好,其元素类型也就确定了,我们也就只能操作指定类型的数据了

缺点:一旦初始化以后,其长度就不可修改。数组中提供的方法非常有限,对于添加、删除、插入等操作非常不便,同时效率不高。获取数组中实际元素的个数需求,数组没有线程的属性或方法可用。数组存储数据的特点。有序可重复,对无序不可重复的需求,不能满足。

集合可分为Collection和Map两种体系
Collection接口:单列数据,定义了存取一组对象的方法的集合
List:元素有序、可重复的集合
Set:元素无序、不可重复的即可
Map接口:双列数据,保存具有映射关系"key-value"对的集合

集合框架

|----Collection接口:单列集合,用来存储一个一个的对象
	|----List接口:存储有序的、可重复的数据。-->"动态"数组
		|----ArrayList、LinkedList、Vector
	|----set接口:存储无序的、不可重复的数据。
		|----HashSet、LinkedHashSet、TreeSet
|----Map接口:双列集合,用来存储一对(key-value)的数据
	|----HashMap、LinkedHashMap、TreeMap、HashTable、Properties

Collection接口中的方法

向Collection中添加对象时,该对象所在的类要重写equals()方法
add(Object e):将元素e添加到集合中
size():获取添加元素的个数
addAll(Collection coll1):添加coll1集合中的元素添加到当前的集合中
isEmpty():判断当前集 合是否为空;
clear():清空集合元素
boolean contains(Object obj):是通过元素的equals方法来判断是否是同一个对象
boolean containsAll(Collection c):也是调用元素的equals方法来比较的,拿两个集合的元素挨个比较
boolean remove(Object obj):删除集合中的元素
boolean remove(Collection coll1):从当前集合中移除coll1中所有的元素
boolean retianAll(Collection coll1):交集:获取当前集合和coll1集合的交集,并返回给当前集合
boolean equals(Object obj):判断当前解和和形参元素都相同
int hasCode():返回当前对象的哈希值
Object[] toArray():返回一个当前集合的数组

iterator():返回Iterator接口的实例,用于遍历集合的元素

拓展:数组转换为集合:
List<String> list = Arrays.asList(new String[]{"AAA","bb","cc"});

集合元素的遍历操作,使用迭代器Iterator接口

Collection接口继承了java.lang.lterable接口,该接口有一个iterator()方法,那么所有实现了Collection接口的集合类都有一个iterator()方法,用以返回一个实现了lterator接口的对象。
lterator 仅用于遍历集合,lterator 本身并不提供承装对象的能力。如果需要创建lterator 对象,则必须有一个被迭代的集合。
集合对象每次调用iterator()方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。

boolean hasNext():判断是否还有下一个元素

T next():1、指针下移,2、将下移以后集合位置上的元素返回

boolean remove():移除当前元素,可以在遍历的时候删除集合中的元素,此方法不同于集合直接调用remove()
注意:如果还未调用next()或在上一次调用next方法后已经调用了remove方法,在调用remove都会报IllegalStateException

Iterator iterator = coll.iterator();
while(iter.hasNext()){
	System.out.println(iterator.next());
}

使用foreach循环遍历集合元素 jdk5.0新增 用于遍历集合,数组

内部仍然调用迭代器

//for(集合元素的类型 局部变量:集合对象)
for(Object obj : coll){
System.out.println(obj);
}
	int arr = new int[1,2,3,4,5,6];
	//for(数组元素的类型 局部变量 :数组对象)
	for(iant i : arr){
		System.out.println(i);
	}

List接口

元素有序,且可重复,List容其中都对应一个整数型的序号记载其在容其中的位置,可以根据序号存取容器中的元素,常见的有ArrayList、LinkedList和Vector
ArrayList:作为List接口的主要实现类,线程不安全的,效率高,底层使用Object[]存储
LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高,底层使用双向链表存储
Vector:作为List接口的古老实现类,线程安全的,效率低

ArrayList的源码分析

jdk 7情况下

ArrayList list = new ArrayList();//底层创建了长度为10的Objectp[]书uElementData
list.add(123);//elementData[0] = new Integer(123);
...
List.add(11);//如果此次添加导致底层的elementData数组容量不够,则扩容。默认情况下,扩容为原来容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中

结论:建议开发中给你使用带参的构造器:ArrayuList list = new ArrayList(int capacity)
jdk 8的情况下:

ArrayList list = new ArrayList();//底层Object[] elementData初始化为{},并没有创建长度为10的数组
list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementDatap[0]中。
...
后续的添加和扩容操作与jdk7无异

小结:jdk7中的ArrayList的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存

LinkedList:源码分析

LinkedList linkedList = new LinkedList();//内部声明了Node类型的first和last属性,默认为null
list.add(123);//将123封装到Node中,创建了Node对象
双向链表
其中,Node定义为:
private static class Node<E>{
	E item;
	Node<E> next;
	Node<E> prev;
	Node(Node<E> prev,E element,Node<E> next){
		this.item = element;
		this.next = next;
		this.prev = prev;
	}
}

Vector源码分析

创建对象时,底层都创建了长度为10的数组,在扩容方面,默认扩容为原来的数组长度的2倍。

List接口方法

void add(int index,Object ele):在index位置插入ele元素
boolean addAll(int index,Collection eles):从index位置开始将eles中的所有元素添加今来
Object get(int index):获取指定index位置的元素
int indexOf(Object obj):返回Obj在集合中首次出现的位置
int lastIndexOf(Object obj):返回obj在当前集合中给你末次出现的位置
Object remove(int index):移除指定index位置的元素,并返回此元素
Object set(int index,Object ele):设置指定index位置的元素为ele
List subList(int fromIndex, int toIndex):返回从fromIndex到tolIndex位置的子集合
常用方法:
增:add(Object obj)
删:remove(int index)/remove(Object obj)
改:set(int index,Object ele)
查:get(int index)
插:add(int index,Object ele)
长度:size()
遍历:1.迭代器2.增强for3.普通for

Set接口

|----Set接口:存储无序的不可重复的数据
	|----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
		|-----LinkedHashSet:作为Hash子类:遍历其内部数据时,可以按照添加顺序遍历
	|----TreeSet:可以按照添加的对象和指定属性进行排序

set接口中没有定义新的方法,使用的都是Collection中声明的方法
要求:向set中添加的数据,其所在的类一定要重写hashCode()和equals()重写的hashCode()尽可能保证一致性:相等的对象必须具有相等的散列码

Set存储无序的不重复的数据
以HashSet为例说明
1.无序性,不等于随机性。存储的数据在底层数组中并非按照索引的顺序添加,而是根据数据的哈希值确定
2.不可重复性:保证添加的元素按照equals()判断时,不能返回true,即相同的元素只能添加一个。

添加元素的过程:以HashSet为例:
我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出HasSet底层数组中的存放位置(即为索引位置),判断数组此位置上是否已经有元素:如果此位置上没有其他元素,则元素a添加成功。如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值,如果hash值不同,则元素a添加成功。如果hash值相同,进而需要调用元素a所在类的equals()方法equals()返回true,元素a添加失败,equals()返回false,则元素a添加成功。元素a与存在指定索引位置上数据以链表的方式存储。jdk7 :元素a放到数组中,指向原来的元素。
jdk8中:原来的数组在数组中,指向a元素

HashSet底层:数组+链表的结构

LinkedHashSet使用

LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据的前一个数据和后一个数据
优点:对于频发的遍历操作,LinkedHashSet效率高于HashSet

TreeSet

1、向TreeSet中添加数据,要求时相同的类的对象
2、两种排序方式:自然排序(实现Comparable接口)和定制排序 (Comparator)
3、自然排序中,比较两个对象是否相同的标准为:compareTo()返回0,不再是euqals().
4.定制排序中,比较两个对象是否相同的标准为:compare()返回0,不再是equals()

Map接口

|-----Map:双列数据,存储key-value对的数据 
	|-----HashMap:作为Map的主要实现类:线程不安全的,效率高;存储null的key和value
		|-----LinkedHashMap:保证在遍历map元素时,可以按照添加的顺序实现遍历 原因:在原有的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素,对于频繁的遍历操作,此类的执行效率高于HashMap
	|-----TreeMap:保证按照添加的key-value对进行排序,实现排序遍历,此时考虑key的自然排序或定制排序,底层使用红黑树
	|-----Hashtable:作为古老的实现类;线程安全的效率低;不能存储null的key和value
		|-----Properties:常用来处理配置文件,key和value都是String类型

HashMap的底层:数组+链表(jdk7及之前) 数组+链表+红黑树(jdk8)

1.HashMap的底层实现原理?
2.HashMap和Hashtable的异同
3.CurrentHashMap和Hashtable的异同

Map结构的理解:
Map中的key:无序的、不可重复的,使用Set存储的所有的key --->key所在的类要重写equals()和hasCode()方法 以HashMap为例
Map中的value:无序的、可重复的,使用Collection存储所有的value ---->value所在的类要重写equals()
一个键值对:key-value构成了一个Entry对象。
Map中的entry:无序的、不可重复的,使用Set存储所有的entry

HashMap的底层实现原理

jdk7为例:
HashMap map = new HashMap();
在实例化以后,底层创建了长度是16的一维数组Entry[] table
...可能已经执行过多次put...
map.put(key1,value1):
首先调用key1所在类的hashCode()计算key1哈希值,此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置
如果此位置上的数据为空,此时的key1-value1添加成功-----情况一
如果此位置上的数据不为空,(意味着此位置上存在一个或多个数据(以链表形式存在)),比较key1和已经存在的一个或多个数据的哈希值:
如果key1的哈希值与已经存在的数据的哈希值都不相同,此时key1-value1添加成功-----情况二
如果key1的哈希值与已经存在的某一个数据(key2-value2)的哈希值相同,继续比较:调用key1所在类的equals()方法:比较:
如果equals()返回false:此时key1-value1添加成功 -----情况三
如果equals()返回true:使用value1替换value2
关于情况2和情况三:此时key1-value1和原来的数据以链表的方式存储

在不断的添加中,会涉及到扩容问题,当超出临界值(且要存放的位置非空)时,扩容。默认的扩容方式:扩容为原来的2倍,并将原有的数据复制过来。

jdk8相较于jdk7在底层实现方面的不同:
1.new HashMap():底层没有创建一个长度为16的数组
2.jdk 8底层的数组是Node[],而非Entry[]
3.首次调用put()方法是,底层创建长度为16的数组
5.jdk7底层结构只有:数组+链表。jdk8中底层的结构:数组+链表+红黑树
当数组的某一个索引位置上的元素以链表形式存在的数据个数>8且当前数组的长度>64时,此时此索引位置上的所有数据改为使用红黑树存储。
DEFAULT INITIAL CAPACITY : HashMap的默认容量,16
DEFAULT_LOAD_FACTOR: HashMap的默认加载因子: 0.75
threshold:扩容的临界值,=容量*填充因子:16 * 0.75 => 12
TREEIFY_THRESHOLD: Bucket中链表长度大于该默认值,转化为红黑树:8
MIN_TREEIFY_CAPACITY: 桶中的Node被树化时最小的hash表容量:64

LinkedHashMap的底层实现

源码中:
static class Entry<K, V> extends HashMap.Node<K, V> {
	Entry<K, V> before, after;//能够记录添加的元素的先后顺序
	Entry(int hash, K key, V value, Node<K, V> next) {
		super(hash, key, value, next);
	}
}

Map接口中定义的方法

添加、删除、修改操作:
Object put(Object kye,Object value):将指定key-value 添加到(或修改)当前map对象中
void putAll(Map m):将m中的所有的key-value对存放到当前map中
Object remove(Object key):移除指定key的key-value对,并返回value
void clear():清空当前map中的所有数据

元素查询的操作
Object get(Object key):获取指定Key对应的value
boolean containsKey(Object key):是否包含指定的key
boolean containsValue(Object value):是否包含指定的value
int size():返回map中key-value对的个数
boolean isEmpty():判断当前map是否为空
boolean equals(Object obj):判断当前map和参数对象obj是否相等。

元试图操作的方法:
Set keySet():返回所有key构成的Set集合
Collection values():返回所有value构成的Collection集合
Set entrySet():返回所有key-value对构成的Set集合。

//遍历所有的key集合:keySet()
Set set = map.keySet();
Iterator iterator = set.iterator();
while(iterator.hasNext){
	System.out.println(itertor.next);
}
//遍历所有的value集合:values();
Collection  values = map.values();
for(Object obj :values){
	System.out.println(obj);
}
//遍历所有的key-value
//方式一:
Set entrySet = map.entrySet();
Iterator  iterator1 = enterySet.iterator();
while(itertor1.hasNext()){
	Object obj = iterator1.next();
	//entrySet集合中的元素都是Entry
	Map.Entry entry = (Map.Entry)obj;
	System.out.println(entry.getKey()+"---->"+entry.getValue());
}
//方式二:
Set keySet = map.keySet();
Iterator iterator = set.iterator();
while(iterator.hasNext()){
	Object key = iterator.next();
	Object value = map.get(key);
	System.out.println(key+"====>"+value);
}

总结:
添加:put(Object key,Object value)
删除:remove(Object key)
修改:put(Object key,Object value)
查询:get(key)
长度:size()
遍历:keySet()/values()/entrySet()

TreeMap

向TreeMap中添加key-value,要求key必须是由同一个类创建的对象,因为要按照key进行排序:自然排序、定制排序

Properties

Properties 类是 Hashtable 的子类,该对象用于处理属性文件由于属性文件里的 key、value 都是字符串类型,所以 Properties 里的 key和 value 都是字符串类型存取数据时,建议使用setProperty(String keyString value)方法和getProperty(String key)方法

Properties pros = new Properties();
pros.load(new FileInputStream("jdbc.properties"));
String user = pros.getProperty("user");
System.out.printIn(user);

Collections工具类

Collections是一个操作Set、List和Map等集合的工具类
Collections 中提供了一系列静态的方法对集合元素进行排序、查询和修改等操作,还提供了对集合对象设置不可变、对集合对象实现同步控制等方法
排序操作: (均为static方法)

reverse(List): 反转 List 中元素的顺序

shuffle(List): 对 List 集合元素进行随机排序

sort(List): 根据元素的自然顺序对指定 List 集合元素按升序排序

sort(List,Comparator): 根据指定的 Comparator 产生的顺序对 List 集合元素进行排序

swap(List,int, int):将指定 list 集合中的i处元素和处元素进行交换

查找、替换
Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
Object max(Collection,Comparator): 根据 Comparator 指定的顺序,返回给定集合中的最大元素
Object min(Collection)
Object min(Collection, Comparator)
int frequency(Collection,Object): 返回指定集合中指定元素的出现次数
void copy(List dest,List src): 将src中的内容复制到dest中
boolean replaceAll(List list,Object oldVal,Object newVal): 使用新值替换List 对象的所有旧值

Collections 类中提供了多个 synchronizedXxx() 方法,该方法可使将指定集合包装成线程同步的集合,从而可以解决多线程并发访问集合时的线程安全问题
例子:List list1 = Collections.synchronizedList(list);

posted @ 2023-05-16 15:52  生活的样子就该是那样  阅读(25)  评论(0)    收藏  举报