Java里的集合相关类-Collection
一、集合框架的概述
1.集合、数组都是对多个数据进行存储操作的结构,简称Java容器
说明:此时的存储,主要指的是内存层面的存储,不涉及到持久化的存储(.txt,.jpg,.avi,数据库中)
2.1 数组在存储多个数据方面的特点:
一旦初始化之后,其长度就确定了。
数组一旦定义好,其元素的类型也就确定了。我们也就只能操作指定类型的数据了。比如:String[] arr; int[] arr; Object[] arr;
2.2 数组在存储多个数据方面的缺点:
一旦初始化以后,其长度就不可修改
数组中提供的方法非常有限,对于添加、删除、插入数据等操作,非常不便,同时效率不高。
获取数组中实际元素的个数的需求,数组没有现成的属性或方法可用。
数组存储数据的特点 :有序,可重复,对于无序的需求、不可重复的需求,不能满足。
二、Java集合可分为Collection和Map两种体系
Collection 接口 :单列集合,用来存储一个一个的对象
> List :存储有序,可重复的数据--->"动态数组"
ArrayList,LinkedList,Vector
> Set:存储无序,不可重复的数据---> 无序性,确定性,互异性
HashSet,LinkedHashSet,TreeSet
Map接口:双列集合,用来存储一对(key-value)一对的数据。-->一个key不可以对应多个value,一个value可以对应多个key
HashMap,LinkedHashMap,TreeMap,HashTable,Properties


三、Collection接口中的方法
add(Object e):将元素e添加到集合coll中
size():获取添加的元素的个数
addAll(Collection coll1) :将coll1集合中的元素添加到当前的集合中
clear() 将集合中的内容清空。
isEmpty();判断当前集合是否为空
contains(Object o)判断元素o是否存在,返回boolean
containsAll(Collection coll2):判断形参coll1中的所有元素是否都等于当前集合中的
remove(Object o) 从当前集合移除指定的o元素,返回布尔值。此处也潜在调用了equals方法。
removeAll(Collection coll1):从当前集合中移除coll1集合中所有的元素,返回布尔值。此处也潜在调用了equals方法。
retainAll(Collection coll1):获取当前集合和coll1的交集,并修改当前集合内容为交集
equals(Object obj):判断当前集合和形参集合是否一致,返回一个布尔值。
hashCode() 返回当前对象的hash值
集合-->数组:toArray()
数组-->集合:调用Arrays的静态方法 Arrays.aeList()
iterator():返回Iterator接口的实例,用于遍历集合的元素
@Test public void test1(){ Collection coll = new ArrayList(); //add(Object e):将元素e添加到集合coll中 coll.add("AA"); coll.add(123); coll.add("BB"); coll.add(new Date()); coll.add(new Person("tom",12)); //size():获取添加的元素的个数 System.out.println(coll.size());//4 //addAll(Collection coll1) :将coll1集合中的元素添加到当前的集合中 Collection coll1 = new ArrayList(); coll1.add(456); coll1.add("cc"); coll.addAll(coll1); System.out.println(coll.size());//6 System.out.println(coll); //clear() 将集合中的内容清空。 // coll.clear(); //isEmpty();判断当前集合是否为空 System.out.println(coll.isEmpty()); //contains(Object o)判断元素o是否存在,返回boolean.判断时会调用obj对象所在类的equals方法 boolean isCc = coll.contains("cc"); System.out.println(isCc); //containsAll(Collection coll2):判断形参coll1中的所有元素是否都等于当前集合中的 List list = Arrays.asList(123,456); System.out.println(coll.containsAll(list)); } @Test public void test2(){ Collection coll = new ArrayList(); coll.add("AA"); coll.add(123); coll.add("BB"); coll.add(new Date()); coll.add(new Person("tom",12)); //remove(Object o) 从当前集合移除指定的o元素,返回布尔值。此处也潜在调用了equals方法。 coll.remove(123); //removeAll(Collection coll1):从当前集合中移除coll1集合中所有的元素,返回布尔值。此处也潜在调用了equals方法。 Collection coll1 = Arrays.asList(123, "BB"); boolean b = coll.removeAll(coll1); //retainAll(Collection coll1):获取当前集合和coll1的交集,并修改当前集合内容为交集 //equals(Object obj):判断当前集合和形参集合是否一致,返回一个布尔值。 //hashCode() 返回当前对象的hash值 System.out.println(coll.hashCode()); //集合-->数组:toArray() Object[] arr = coll.toArray(); //数组-->集合:调用Arrays的静态方法 Arrays.aeList() List<Object> list = Arrays.asList(arr); //iterator():返回Iterator接口的实例,用于遍历集合的元素 }
集合元素的遍历操作,使用Iterator接口
原理:调用hasNext时判断下面有没有元素,有的话,指针下移同时调用Next()
集合对象每次调用iterator方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。
1.内部的方法:hasNext() 和 next()
2.集合对象每次调用iterator方法都得到一个全新的迭代器对象,默认游标都在集合的第一个元素之前。
3.内部定义了remove()默认方法,可以在遍历的时候删除集合中的元素。此方法不同于集合直接调用remove,而是通过迭代器调用。
增强for循环:内部仍然调用了迭代器
for(集合元素类型 局部变量:集合对象){
//具体操作
}

@Test public void test(){ Collection coll = new ArrayList(); coll.add("AA"); coll.add(123); coll.add("BB"); coll.add(new Date()); coll.add(new Person("tom",12)); Iterator iterator = coll.iterator(); while(iterator.hasNext()){ System.out.println(iterator.next()); }
List接口
List接口:存储有序的,可重复的数据。-->动态数组,替换原有的数组
ArrayList,LinkedList,Vector三者的异同
不同:
ArrayList:作为List接口的主要实现类,线程不安全的,效率高。底层使用Object[] elementData存储
LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储。
Vector:作为List接口的古老实现类,线程安全的,效率不高。底层使用Object[] elementData存储。
相同:三个类都实现了List接口,存储数据的特点相同:存储有序的,可重复的数据
2.ArrayList的源码分析:
2.1 jdk 7的情况下:
ArrayList list = new ArrayList();//底层创建了一个长度为10 的Object[]数组elementData
list.add(123);// elementData[0] = new Integer(123)
...
list.add(11);如果此次的添加导致底层elementData数组容量不够,则扩容。
默认情况下,扩容为原来容量的1.5倍,同时需要将原有数组的数据复制到新的数组中。
结论: 建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)
2.2 jdk8当中ArrayList的变化:
ArrayList list = new ArrayList();//底层 Object[]数组elementData 初始化为{},并没有创建长度为10的数组
list.add(123);//第一次调用add()时,底层才创建了长度为10的数组,并将123添加到Object[]数组elementData
...
后续的添加和扩容和jdk7一致。
2.3 小结:jdk7中的ArrayList的创建类似于单例的饿汉模式,
而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。
3.LinkedList的源码分析:
LinkedList list = new LinkedList();//内部声明了Node类型的first和last属性,默认值为null。(双向链表)
list.add(123);//将123封装到Node中,创建了Node对象。
其中,Node定义为:
private static class Node<E> {
E item;
Node<E> next;
Node<E> prev;
Node(Node<E> prev, E element, Node<E> next) {
this.item = element;
this.next = next;
this.prev = prev;
}
}
4.Vector 的源码分析:jdk7和jdk8 中通过Vector()构造器创建对象时,
底层都创建了长度为10的数组,在扩容方面,默认扩容为原来数组长度的2倍。
5.List接口中的常用方法
add(E e):在集合末尾添加元素e。
add(int index, E element):将element添加到当前集合的指定索引中。
addAll(Collection<? extends E> c):将集合c的内容全部添加到当前集合中。
indexOf(Object o) 返回o 在集合中首次出现的位置
lastIndexOf(Object o) 返回o 在集合中末次出现的位置
remove(int index) 按照索引删除元素,返回删除的元素
remove(Object o) 删除指定元素,返回布尔值
subList(int fromIndex, int toIndex) 返回一个按照索引左闭右开的子集合。
set(int index, E element) 把指定索引更改为指定元素
size() 获取长度
一、Set接口的框架结构
--Collection接口
--Set接口:存储无序的,不可重复的数据
--HashSet:作为Set接口的主要实现类;线程不安全的,可以存储null值。
--LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历
--TreeSet:可以按照添加对象的指定属性,进行排序。
1.Set接口中没有额外定义新的方法,使用的都是Collection中声明过的方法。(List因为有索引,所以有新的额外的方法)
2.要求:向Set中添加的数据,其所在类一定要重写hashCode()方法和equals()方法
要求:重写的hashCode()方法和equals()方法尽可能保持一致性。"相等的对象必须具有相等的散列码。
重写两个方法的小技巧:对象中用作equals()方法比较的Field,都应该用来计算hashCode
一、Set:存储无序的,不可重复的数据
以HashSet为例说明:
1.无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的hash值
2.不可重复性:保证添加的元素按照equal()方法判断时,不能返回true。即:相同的元素只能添加一个
二、添加元素的过程:以HashSet为例说明:
我们向HashSet小红添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值
接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断数组此位置上是否已有元素:
如果此位置上没有其他元素,则元素a添加成功。--情况1
如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
如果hash值不相同,则元素a添加成功。 --情况2
如果hash值相同,进而需要调用元素a所在类的equals()方法:
equals()返回true,元素a添加失败。
equals()返回false,则元素a添加成功。--情况3
对于添加成功的情况2和情况3而言,元素a与已经存在指定索引位置上的数据以链表的方式存储。
jdk 7:元素a放到数组中,指向原来的元素
jdk 8:原来的元素在数组中,指向元素a
hashSet底层:数组+链表的结构

LinkedHashSet的使用
LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。
优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
TreeSet:
1.向TreeSet中添加的数据,要求是同一个类的对象。
2.两种排序方式:自然排序(实现comparable接口) 和 定制排序(Comparator)
3.自然排序中,比较两个对象是否相同的标准为:compareTo()返回0,不再是equals()。
4.定制排序中,比较两个对象是否相同的标准为:compare()返回0,不再是不再是equals()。
@Test public void test4() { Comparator com = new Comparator() { //按照年龄从小到大排序 @Override public int compare(Object o1, Object o2) { if(o1 instanceof Person && o2 instanceof Person){ Person p1 = (Person)o1; Person p2 = (Person)o2; return Integer.compare(p1.getAge(),p2.getAge()); }else{ throw new RuntimeException("输入的数据类型不匹配"); } } }; TreeSet set = new TreeSet(com);//写上com就是定制排序,不写就是自然排序 set.add(new Person("tom",20)); set.add(new Person("frank",23)); set.add(new Person("kate",32)); set.add( new Person("may",23)); Iterator iterator = set.iterator(); while(iterator.hasNext()){ System.out.println(iterator.next()); } }
一道思考题:


浙公网安备 33010602011771号