Java 基础——集合

为什么要用集合？

数组用于对多个同类型数据的存储，是 Java容器。（这里的存储是内存中的存储，不涉及持久化的存储）

数据存储的特点：初始化后即确定长度。方法有限、效率不高、实际元素个数无法直接获取，arr.length 获取的是数组的总长度，即初始化的那个确定的长度。

回答：因为已有的 Java容器——数组不能满足各种需求，所以有了集合。

集合介绍

Java的集合分为两大类：实现了 Collecion 接口的和实现了 Map 接口的。

注意二者的区别：Collection 是单列集合，存储一个个的对象，Map 则是双列集合，存储键值对。

Collection

实现了 Collection 类的结构图如下：

绿色的是接口，蓝色的是具体实现类。

Collection 接口的常用方法

增：

add(Object obj)，

addAll(Collection coll)

删：

remove(Object obj)：通过元素的equals方法判断是否是要删除的那个元素。只会删除找到的第一个元素

removeAll(Collection coll)：取当前集合的差集

改：

clear()

toArray()：转成对象数组

查：

size()

isEmpty()

contains(Object obj)：是通过元素的equals方法来判断是否是同一个对象

containsAll(Collection coll)：也是调用元素的equals方法来比较的。拿两个集合的元素挨个比较

retainsAll(Collection coll)：把交集的结果存在当前集合中，不影响coll

equals(Object obj) 【这是？？？】

hasCode():获取集合对象的哈希值

iterator()：返回迭代器对象，用于集合遍历

🧐【针对上面的 equals 方法的一个疑问？】

List<String> lst1 = new ArrayList<>();
List<String> lst2 = new ArrayList<>();
String s1 = new String("haha");
String s2 = new String("haha");

lst1.add(s1);
lst2.add(s2);

System.out.println(lst1.equals(lst2));

输出：true。

public void test2(){
        ArrayList<Person> l1 = new ArrayList<>();
        ArrayList<Person> l2 = new ArrayList<>();

        Person p1 = new Person("xiaoyueliang", 12);
        Person p2 = new Person("xiaoyueliang", 12);

        l1.add(p1);
        l2.add(p2);
        System.out.println(l1.equals(l2));
    }

输出：false。

🧐我好像对 equals 方法有点疑惑，还有 String 的存储方式？

注意：使用实现了 Collection接口的集合存储某些类，该类需要重写 equals 方法。

为什么？

因为 Collection 里面有的方法需要比较。

🧐这是什么意思？

🌙：其实就是上面那个 Person 的例子一样，明明存进去的是同一个东西（内容上），但是 equals 方法返回的是 false，现实使用中，我们其实更在乎内容，而不是“地址值”。所以需要重写一下 Person 的equals 方法，对比的是内容，而不是 Object 默认的 equals 方法对比的“地址值”。

重写一下 Person 中的 equals 方法：

@Override
    public boolean equals(Object obj) {
        if(this == obj){
            return true;
        }
        if(obj == null){
            return false;
        }
        if(getClass() != obj.getClass()){
            return false;
        }
        Person p = (Person) obj;
        return this.name.equals(p.name) && this.id == p.id;

    }

这样，test2()的输出就是 true 了。

PS：😄重写 equlas 方法我总是忘了怎么写，觉得很害怕写 equlas 方法。在《Java 核心技术卷 I》中文版的 P117 里面有一个写 equals 的完美建议：

对于 public boolean equals(Object obj），其实我们只要记住，目标是：比较具体内容。

1. 显示参数的命名是 obj；

2. 先比较引用是否相同：

if(this == obj)
　　return true;

3. 空值判断

if(obj == null)
    return false;

4. 类型比较（🧐：这里的类型，子类的话怎么样呢）【⭐其实这里用 instanceof 更好】

if(this.getClass != obj.getClass)
    return fasle;

5. 经过了 4 ，能到这步的都是类型相同的，所以先类型转换一下：

ClassName other = (ClassName) obj;

6. ClassName 中的域比较

准则就是，基本类型用 ==，应用类型用 Object.equals。（实际上没有这个静态方法，这里的意思是用上父类的重写 equals 方法）

return field1 == other.field1 && Object.equals(field2, other.field2);

看一下 String 中的equals 方法。

public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;

String 的类型比较是子类欸，《Java 核心技术卷I》给的是getClass，这样可以看出，用 instanceof 更好。

对比一下 getClass 和 instanceof

Person p1 = new Person("xioayueliang", 12);
Student s1 = new Student("xinxin", 24, 9);
System.out.println(p1.getClass());　　// class pers.xyl.java.Person
System.out.println(s1.getClass());　　// class pers.xyl.java.Student

instanceof

boolean result = obj instanceof Class

其中 obj 为一个对象，Class 表示一个类或者一个接口，当 obj 为 Class 的对象，或者是其直接或间接子类，或者是其接口的实现类，结果result 都返回 true，否则返回false。

Object 的 equals

public boolean equals(Object obj) {
        return (this == obj);
    }

可以看到，就是比较引用值。

其实这可以从“为什么我们需要 equals？”角度来想。

因为我们现实生活中，更多的是需要比较“实际内容”，至于在计算机里面的存储，我们并不关心。但是原本的比较方法 “==”，只有在对基本变量类型的时候才是“比较内容”，在面对引用类型的时候是“比较地址”。这不是我们想要的。所以我们都会重写 equals 方法。而String 类已经重写好了，我们自己构造类的时候，如果是存在比较关系的类，最好也是要重写的吧?

数组与集合的转换

//集合 --->数组：toArray()
Object[] arr = coll.toArray();
for(int i = 0;i < arr.length;i++){
    System.out.println(arr[i]);
}

//拓展：数组 --->集合:调用Arrays类的静态方法asList(T ... t)
List<String> list = Arrays.asList(new String[]{"AA", "BB", "CC"});
System.out.println(list);

对于数组 --> 集合，需要注意以下的情况：

// 情况 1
List arr1 = Arrays.asList(new int[]{123, 456});
System.out.println(arr1.size());//1

// 情况 2
List arr2 = Arrays.asList(new Integer[]{123, 456});
System.out.println(arr2.size());//2

注意：情况 1 是把整个数组当成一个元素放进了集合里，情况 2 则是把数组里的元素一个一个地放进去。

Iterator 接口和 foreach 循环

遍历 Collection 的两种方法：迭代器 Iterator ；foreach 循环

Iterator 对象称为迭代器。而 Collection 中的 iterator 方法就是返回一个迭代器实例。

// 对集合 coll 调用 iterator() 方法，获得一个迭代器。
Iterator iterator = coll.iterator();

while(iterator.hasNext()){
    System.out.println(iterator.next());
}

Iterator 类：

要注意 Iterator 类的 remove() 和 Collection 的 remove()。

Iterator 类的 remove() 要搭配 next() 使用。

《Java 核心技术卷I》里面说到，next() 其实更像是指在了两个元素之间，我们只要越过了要删除的那个元素，即使用了 next()之后，才可以 remove()。很显然嘛，毕竟我们总要看一下里面是什么才进行删除。

foreach 循环

//for(集合元素的类型 局部变量 : 集合对象)
    
for(Object obj : coll){
    System.out.println(obj);
}

说明：内部仍然使用了迭代器。【🧐，这是咋知道的，这种情况看不了源码啊？】

一个注意点：这种遍历的方法，那个“集合元素类型”，即使使用泛型定义了具体的集合类型，这里好像也只能写“Object"。🧐【好吧，这个”好像“是错误的，之前的模糊印象，谁让我当时不搞清楚！】

例子如下：

public void test2(){
        ArrayList<Integer> list = new ArrayList<>();
        list.add(1);
        list.add(2);

        for(int i:list){
            System.out.println(i);
        }
    }

使用了泛型，就可以在 foreach 里面用实际的集合元素类型。

Collection 子接口—— List 接口

常用方法

增：add(Object obj)

　　add(int index, Object ele)

删：remove(int index) / remove(Object obj)

改：set(int index, Object ele)

查：get(int index)

　　size()

遍历：

① Iterator迭代器方式

② 增强for循环

③ 普通的循环

常用实现类

Collection接口：单列集合，用来存储一个一个的对象

List接口：存储序的、可重复的数据。 --> “动态”数组，替换原的数组
- ArrayList：作为 List 接口的主要实现类；线程不安全的，效率高；底层使用Object[] elementData存储
- LinkedList：对于频繁的插入、删除操作，使用此类效率比ArrayList高；底层使用双向链表存储
- Vector：作为List接口的古老实现类；线程安全的，效率低；底层使用Object[] elementData存储

ArrayList 源码分析

jdk 7

ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
list.add(123);//elementData[0] = new Integer(123);
...
list.add(11);//如果此次的添加导致底层elementData数组容量不够，则扩容。

默认情况下，扩容为原来的容量的1.5倍，同时需要将原有数组中的数据复制到新的数组中。

结论：建议开发中使用带参的构造器：ArrayList list = new ArrayList(int capacity)

jdk 8

ArrayList list = new ArrayList();//底层Object[] elementData初始化为{}.并没创建长度为10的数组
list.add(123);//第一次调用add()时，底层才创建了长度10的数组，并将数据123添加到elementData[0]
...

jdk7中的ArrayList的对象的创建类似于单例的饿汉式，

而jdk8中的ArrayList的对象的创建类似于单例的懒汉式，延迟了数组的创建，节省内存。

LinkedList 源码分析

// 内部声明了Node类型的first和last属性，默认值为null，即底层是双向链表
LinkedList list = new LinkedList(); 

list.add(123);//将123封装到Node中，创建了Node对象。

private static class Node<E> { // 其中，Node定义为：体现了LinkedList的双向链表的说法
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
    this.item = element;
    this.next = next;
    this.prev = prev;
    }
}

Vector 源码分析

jdk7和jdk8中通过Vector()构造器创建对象时，底层都创建了长度为10的数组。在扩容方面，默认扩容为原来的数组长度的2倍。

Collection 子接口 —— Set 接口

与 List 接口的区别。【🌙：一个东西存在，要问为什么存在？】

List：有序，可重复

Set：无序，不可重复

如何保证这种“不可重复”呢？

👇

元素添加的过程（以 HashSet 为例子）

我们向HashSet中添加元素a，首先调用元素a所在类的hashCode()方法，计算元素a的哈希值，此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置（即为：索引位置，判断数组此位置上是否已经元素：

【计算两个东西：1 哈希值，2 索引。🌙：不同的哈希值经过某种算法也可能得出相同的结论】x 不同，有可能 y 同，但是 y 不同，那么 x 肯定不同。这是数学上函数的基本要求。这里的 x 可以指元素，y 则是哈希值。元素是横坐标，哈希值是纵坐标，因为是 f(元素）= 哈希值。

如果此位置上没其他元素，则元素 a 添加成功。 ---> 情况1

如果此位置上其他元素 b (或以链表形式存在的多个元素，则比较元素a与元素b的hash值：

　　如果hash值不相同，则元素 a 添加成功。---> 情况2

　　如果hash值相同，进而需要调用元素 a 所在类的equals()方法：【🧐：哈希值相同代表了什么？因为 hashCode() 可以重写，所以还是不能保证内容相同，所以要进行 equals 比较】

　　　　 equals()返回true，元素a添加失败

　　　　 equals()返回false，则元素a添加成功。---> 情况3

对于添加成功的情况2和情况3而言：元素a 与已经存在指定索引位置上数据以链表的方式存储。

jdk 7 :元素a放到数组中，指向原来的元素。

jdk 8 :原来的元素在数组中，指向元素a。

HashSet底层：数组+链表的结构。（前提：jdk7)【🧐what the hell？jdk8咋样的呢？】

总结一下：hash值不同的话就可以代表这两个元素不同，但是hash值相同，有可能是“哈希碰撞”、“哈希冲突”现象，所以要继续比较内容，即使用 equals。

常用实现类

Collection接口：单列集合，用来存储一个一个的对象

Set接口：存储无序的、不可重复的数据 -->高中讲的“集合”

HashSet：作为Set接口的主要实现类；线程不安全的；可以存储null值
LinkedHashSet：作为HashSet的子类；遍历其内部数据时，可以按照添加的顺序遍历在添加数据的同时，每个数据还维护了两个引用，记录此数据前一个数据和后一个数据。对于频繁的遍历操作，LinkedHashSet效率高于HashSet.
TreeSet：可以照添加对象的指定属性，进行排序。

存储对象所在类的要求

HashSet/LinkedHashSet:

要求：向Set(主要指：HashSet、LinkedHashSet)中添加的数据，其所在的类一定要重写hashCode()和equals() （ “相等的对象必须具有相等的散列码”。）

要求：重写的hashCode()和equals()尽可能保持一致性：相等的对象必须具有相等的散列码

重写两个方法的小技巧：对象中用作 equals() 方法比较的 Field，都应该用来计算 hashCode 值。

TreeSet: 1.自然排序中，比较两个对象是否相同的标准为：compareTo()返回0，不再是equals(). 2.定制排序中，比较两个对象是否相同的标准为：compare()返回0，不再是equals().

TreeSet 的使用

TreeSet 是 SortedSet 接口的实现类，TreeSet 可以确保集合元素处于排序状态。

TreeSet底层使用红黑树结构存储数据。

使用注意：

1.向TreeSet中添加的数据，要求是相同类的对象。

【🌙，不相同，报错：java.lang.ClassCastException。所以底层到底是咋写的。】

2.两种排序方式：自然排序和定制排序，默认情况下使用自然排序。

 1 //方式一：自然排序
 2 @Test
 3     public void test1(){
 4         TreeSet set = new TreeSet();
 5 
 6         set.add(new User("Tom",12));
 7         set.add(new User("Jerry",32));
 8         set.add(new User("Jim",2));
 9 
10         Iterator iterator = set.iterator();
11         while(iterator.hasNext()){
12             System.out.println(iterator.next());
13         }
14 
15     }
16 
17 //方式二：定制排序
18     @Test
19     public void test2(){
20         Comparator com = new Comparator() {
21             //照年龄从小到大排列
22             @Override
23             public int compare(Object o1, Object o2) {
24                 if(o1 instanceof User && o2 instanceof User){
25                     User u1 = (User)o1;
26                     User u2 = (User)o2;
27                     return Integer.compare(u1.getAge(),u2.getAge());
28                 }else{
29                     throw new RuntimeException("输入的数据类型不匹配");
30                 }
31             }
32         };
33 
34         TreeSet set = new TreeSet(com);
35         set.add(new User("Tom",12));
36         set.add(new User("Jerry",32));
37         set.add(new User("Jim",2));
38 
39 
40         Iterator iterator = set.iterator();
41         while(iterator.hasNext()){
42             System.out.println(iterator.next());
43         }
44     }

Map 接口

常用实现类结构

Map：双列数据，存储key-value对的数据 ---类似于高中的函数：y = f(x)
- HashMap：作为Map的主要实现类；线程不安全的，效率高；存储null的key和value
  - LinkedHashMap：保证在遍历map元素时，可以照添加的顺序实现遍历。原因：在原的HashMap底层结构基础上，添加了一对指针，指向前一个和后一个元素。对于频繁的遍历操作，此类执行效率高于HashMap。
- TreeMap：保证照添加的key-value对进行排序，实现排序遍历。此时考虑key的自然排序或定制排序底层使用红黑树
- Hashtable：作为古老的实现类；线程安全的，效率低；不能存储null的key和value
  - Properties：常用来处理配置文件。key和value都是String类型

HashMap的底层：数组+链表（jdk7及之前)
数组+链表+红黑树（jdk 8)

存储结构的理解

Map中的key：无序的、不可重复的，使用Set存储所的key ---> key所在的类要重写equals()和hashCode() （以HashMap为例)

Map中的value：无序的、可重复的，使用Collection存储所的value --->value所在的类要重写equals() 一个键值对：key-value构成了一个Entry对象。

Map中的entry：无序的、不可重复的，使用Set存储所的entry

常用方法

添加、删除、修改操作：

Object put(Object key,Object value)：将指定key-value添加到(或修改)当前map对象中

void putAll(Map m):将m中的所key-value对存放到当前map中

Object remove(Object key)：移除指定key的key-value对，并返回value

void clear()：清空当前map中的所数据

元素查询的操作：

Object get(Object key)：获取指定key对应的value

boolean containsKey(Object key)：是否包含指定的key

boolean containsValue(Object value)：是否包含指定的value

int size()：返回map中key-value对的个数

boolean isEmpty()：判断当前map是否为空

boolean equals(Object obj)：判断当前map和参数对象obj是否相等

元视图操作的方法：

Set keySet()：返回所key构成的Set集合

Collection values()：返回所value构成的Collection集合

Set entrySet()：返回所key-value对构成的Set集合

添加：put(Object key,Object value)

删除：remove(Object key)

修改：put(Object key,Object value)

查询：get(Object key)

长度：size()

遍历：keySet() / values() / entrySet()

内存结构说明

HashMap 在 jdk7 中实现原理：

HashMap map = new HashMap()

在实例化以后，底层创建了长度是16的一维数组Entry[] table。

...可能已经执行过多次

put... map.put(key1,value1)

　　首先，调用key1所在类的hashCode()计算key1哈希值，此哈希值经过某种算法计算以后，得到在Entry数组中的存放位置。

　　如果此位置上的数据为空，此时的key1-value1添加成功。 ----情况1

　　如果此位置上的数据不为空，(意味着此位置上存在一个或多个数据(以链表形式存在))，比较key1和已经存在的一个或多个数据的哈希值：

　　　　如果key1的哈希值与已经存在的数据的哈希值都不相同，此时key1-value1添加成功。----情况2

　　　　如果key1的哈希值和已经存在的某一个数据(key2-value2)的哈希值相同，继续比较：调用key1所在类的equals(key2)方法，比较：

　　　　　　如果equals()返回false:此时key1-value1添加成功。----情况3

　　　　　　如果equals()返回true:使用value1替换value2。

补充：关于情况2和情况3：此时key1-value1和原来的数据以链表的方式存储。

在不断的添加过程中，会涉及到扩容问题，当超出临界值(且要存放的位置非空)时，扩容。默认的扩容方式：扩容为原来容量的2倍，并将原的数据复制过来。

HashMap在jdk8中相较于jdk7在底层实现方面的不同：

1. new HashMap():底层没创建一个长度为16的数组
2. jdk 8底层的数组是：Node[],而非Entry[]
3. 首次调用put()方法时，底层创建长度为16的数组
4. jdk7底层结构只：数组+链表。jdk8中底层结构：数组+链表+红黑树。
4.1 形成链表时，七上八下（jdk7:新的元素指向旧的元素。jdk8：旧的元素指向新的元素）
4.2 当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时，此时此索引位置上的所数据改为使用红黑树存储。

HashMap底层典型属性的属性的说明：
DEFAULT_INITIAL_CAPACITY : HashMap的默认容量，16
DEFAULT_LOAD_FACTOR：HashMap的默认加载因子：0.75
threshold：扩容的临界值，=容量*填充因子：16 * 0.75 => 12
TREEIFY_THRESHOLD：Bucket中链表长度大于该默认值，转化为红黑树:8
MIN_TREEIFY_CAPACITY：桶中的Node被树化时最小的hash表容量:64

LinkedHashMap的底层实现原理(了解)

LinkedHashMap底层使用的结构与HashMap相同，因为LinkedHashMap继承于HashMap.
区别就在于：LinkedHashMap内部提供了Entry，替换HashMap中的Node.

HashMap 中的内部类：Node

[插入代码]

LinkedHashMap 中的内部类：Entry

[插入代码]

TreeMap的使用

//向TreeMap中添加key-value，要求key必须是由同一个类创建的对象
//因为要照key进行排序：自然排序、定制排序

使用Properties读取配置文件

//Properties:常用来处理配置文件。key和value都是String类型
public static void main(String[] args)  {
    FileInputStream fis = null;
    try {
        Properties pros = new Properties();

        fis = new FileInputStream("jdbc.properties");
        pros.load(fis);//加载流对应的文件

        String name = pros.getProperty("name");
        String password = pros.getProperty("password");

        System.out.println("name = " + name + ", password = " + password);
    } catch (IOException e) {
        e.printStackTrace();
    } finally {
        if(fis != null){
            try {
                fis.close();
            } catch (IOException e) {
                e.printStackTrace();
            }

        }
    }

Collection 工具类的使用

常用方法

reverse(List)：反转 List 中元素的顺序
shuffle(List)：对 List 集合元素进行随机排序
sort(List)：根据元素的自然顺序对指定 List 集合元素升序排序
sort(List，Comparator)：根据指定的 Comparator 产生的顺序对 List 集合元素进行排序
swap(List，int， int)：将指定 list 集合中的 i 处元素和 j 处元素进行交换
Object max(Collection)：根据元素的自然顺序，返回给定集合中的最大元素
Object max(Collection，Comparator)：根据 Comparator 指定的顺序，返回给定集合中的最大元素
Object min(Collection)
Object min(Collection，Comparator)
int frequency(Collection，Object)：返回指定集合中指定元素的出现次数
void copy(List dest,List src)：将src中的内容复制到dest中
boolean replaceAll(List list，Object oldVal，Object newVal)：使用新值替换 List 对象的所旧值

说明：ArrayList和HashMap都是线程不安全的，如果程序要求线程安全，我们可以将ArrayList、HashMap转换为线程的。
使用synchronizedList(List list）和 synchronizedMap(Map map）

posted @ 2021-05-23 10:58 就叫小月亮阅读(132) 评论(0) 收藏举报

刷新页面返回顶部

Loading

小月亮的博客

Java 基础——集合

为什么要用集合？

集合介绍

Collection

Collection 接口的常用方法

数组与集合的转换

Iterator 接口和 foreach 循环

Collection 子接口—— List 接口

常用实现类

ArrayList 源码分析

LinkedList 源码分析

Vector 源码分析

Collection 子接口 —— Set 接口

元素添加的过程（以 HashSet 为例子）

常用实现类

存储对象所在类的要求

Map 接口

常用实现类结构

存储结构的理解

常用方法

内存结构说明

HashMap 在 jdk7 中实现原理：

LinkedHashMap的底层实现原理(了解)

TreeMap的使用

使用Properties读取配置文件

Collection 工具类的使用

公告

Loading

小月亮的博客

Java 基础——集合

为什么要用集合？

集合介绍

Collection

Collection 接口的常用方法

数组与集合的转换

Iterator 接口 和 foreach 循环

Collection 子接口—— List 接口

常用实现类

ArrayList 源码分析

LinkedList 源码分析

Vector 源码分析

Collection 子接口 —— Set 接口

元素添加的过程（以 HashSet 为例子）

常用实现类

存储对象所在类的要求

Map 接口

常用实现类结构

存储结构的理解

常用方法

内存结构说明

HashMap 在 jdk7 中实现原理：

LinkedHashMap的底层实现原理(了解)

TreeMap的使用

使用Properties读取配置文件

Collection 工具类的使用

公告

Iterator 接口和 foreach 循环