Loading

Java 基础——集合

为什么要用集合?

数组用于对多个同类型数据的存储,是 Java容器。(这里的存储是内存中的存储,不涉及持久化的存储)

数据存储的特点:初始化后即确定长度。方法有限、效率不高、实际元素个数无法直接获取,arr.length 获取的是数组的总长度,即初始化的那个确定的长度。

 

回答:因为已有的 Java容器——数组不能满足各种需求,所以有了集合。

 

集合介绍

Java的集合分为两大类:实现了 Collecion 接口的和实现了 Map 接口的。

注意二者的区别:Collection 是单列集合,存储一个个的对象,Map 则是双列集合,存储键值对

 

Collection

实现了 Collection 类的结构图如下:

绿色的是接口,蓝色的是具体实现类。

 

 

 

Collection 接口的常用方法

增:

add(Object obj)

addAll(Collection coll)

 

删:

remove(Object obj):通过元素的equals方法判断是否是 要删除的那个元素。只会删除找到的第一个元素

removeAll(Collection coll):取当前集合的差集

 

改:

clear()

toArray():转成对象数组

 

查:

size()

isEmpty()

contains(Object obj):是通过元素的equals方法来判断是否是同一个对象

containsAll(Collection coll):也是调用元素的equals方法来比较的。拿两个集合的元素挨个比较

retainsAll(Collection coll):把交集的结果存在当前集合中,不影响coll

equals(Object obj) 【这是???】

hasCode():获取集合对象的哈希值

iterator():返回迭代器对象,用于集合遍历

 

🧐【针对上面的 equals 方法的一个疑问?】

List<String> lst1 = new ArrayList<>();
List<String> lst2 = new ArrayList<>();
String s1 = new String("haha");
String s2 = new String("haha");

lst1.add(s1);
lst2.add(s2);

System.out.println(lst1.equals(lst2));

输出:true。

public void test2(){
        ArrayList<Person> l1 = new ArrayList<>();
        ArrayList<Person> l2 = new ArrayList<>();

        Person p1 = new Person("xiaoyueliang", 12);
        Person p2 = new Person("xiaoyueliang", 12);

        l1.add(p1);
        l2.add(p2);
        System.out.println(l1.equals(l2));
    }

输出:false。

 

🧐我好像对 equals 方法有点疑惑,还有 String 的存储方式?

注意:使用实现了 Collection接口的集合存储某些类,该类需要重写 equals 方法。

为什么?

因为 Collection 里面有的方法需要比较。

🧐这是什么意思?

🌙:其实就是上面那个 Person 的例子一样,明明存进去的是同一个东西(内容上),但是 equals 方法返回的是 false,现实使用中,我们其实更在乎内容,而不是“地址值”。所以需要重写一下 Person 的equals 方法,对比的是内容,而不是 Object 默认的 equals 方法对比的“地址值”。

 

重写一下 Person 中的 equals 方法:

@Override
    public boolean equals(Object obj) {
        if(this == obj){
            return true;
        }
        if(obj == null){
            return false;
        }
        if(getClass() != obj.getClass()){
            return false;
        }
        Person p = (Person) obj;
        return this.name.equals(p.name) && this.id == p.id;

    }

 

这样,test2()的输出就是 true 了。

PS:😄重写 equlas 方法我总是忘了怎么写,觉得很害怕写 equlas 方法。在《Java 核心技术卷 I》中文版的 P117 里面有一个写 equals 的完美建议

对于 public boolean equals(Object obj),其实我们只要记住,目标是:比较具体内容。

1. 显示参数的命名是 obj;

2. 先比较引用是否相同:

if(this == obj)
  return true;

3. 空值判断

if(obj == null)
    return false;

4. 类型比较(🧐:这里的类型,子类的话怎么样呢)【⭐其实这里用 instanceof 更好】

if(this.getClass != obj.getClass)
    return fasle;

5. 经过了 4 ,能到这步的都是类型相同的,所以先类型转换一下:

ClassName other = (ClassName) obj;

6. ClassName 中的域比较

准则就是,基本类型用 ==,应用类型用 Object.equals。(实际上没有这个静态方法,这里的意思是用上父类的重写 equals 方法)

return field1 == other.field1 && Object.equals(field2, other.field2);

 

看一下 String 中的equals 方法

public boolean equals(Object anObject) {
        if (this == anObject) {
            return true;
        }
        if (anObject instanceof String) {
            String anotherString = (String)anObject;
            int n = value.length;
            if (n == anotherString.value.length) {
                char v1[] = value;
                char v2[] = anotherString.value;
                int i = 0;
                while (n-- != 0) {
                    if (v1[i] != v2[i])
                        return false;
                    i++;
                }
                return true;
            }
        }
        return false;

String 的类型比较是 子类欸,《Java 核心技术卷I》给的是getClass,这样可以看出,用 instanceof 更好。

 

 

对比一下 getClass 和 instanceof

Person p1 = new Person("xioayueliang", 12);
Student s1 = new Student("xinxin", 24, 9);
System.out.println(p1.getClass());  // class pers.xyl.java.Person
System.out.println(s1.getClass());  // class pers.xyl.java.Student

 

instanceof

boolean result = obj instanceof Class

其中 obj 为一个对象,Class 表示一个类或者一个接口,当 obj 为 Class 的对象,或者是其直接或间接子类,或者是其接口的实现类,结果result 都返回 true,否则返回false。


Object 的 equals

public boolean equals(Object obj) {
        return (this == obj);
    }

可以看到,就是比较引用值。

 

 

其实这可以从“为什么我们需要 equals?”角度来想。

因为我们现实生活中,更多的是需要比较“实际内容”,至于在计算机里面的存储,我们并不关心。但是原本的比较方法 “==”,只有在对基本变量类型的时候才是“比较内容”,在面对引用类型的时候是“比较地址”。这不是我们想要的。所以我们都会重写 equals 方法。而String 类已经重写好了,我们自己构造类的时候,如果是存在比较关系的类,最好也是要重写的吧?

 

数组与集合的转换

//集合 --->数组:toArray()
Object[] arr = coll.toArray();
for(int i = 0;i < arr.length;i++){
    System.out.println(arr[i]);
}

//拓展:数组 --->集合:调用Arrays类的静态方法asList(T ... t)
List<String> list = Arrays.asList(new String[]{"AA", "BB", "CC"});
System.out.println(list);

对于 数组 --> 集合,需要注意以下的情况:

// 情况 1
List arr1 = Arrays.asList(new int[]{123, 456}); System.out.println(arr1.size());//1
// 情况 2
List arr2 = Arrays.asList(new Integer[]{123, 456}); System.out.println(arr2.size());//2

注意:情况 1 是把整个数组当成一个元素放进了集合里,情况 2 则是把数组里的元素一个一个地放进去。

 

 

 

Iterator 接口 和 foreach 循环

遍历 Collection 的两种方法:迭代器 Iterator ;foreach 循环

Iterator 对象称为 迭代器。而 Collection 中的 iterator 方法就是返回一个 迭代器实例。

// 对集合 coll 调用 iterator() 方法,获得一个迭代器。
Iterator iterator = coll.iterator(); while(iterator.hasNext()){ System.out.println(iterator.next()); }

 

Iterator 类:

 

 

 

要注意 Iterator 类的 remove() 和 Collection 的 remove()。

Iterator 类的 remove() 要搭配 next() 使用。

《Java 核心技术卷I》里面说到,next() 其实更像是指在了两个元素之间,我们只要越过了要删除的那个元素,即使用了 next()之后,才可以 remove()。很显然嘛,毕竟我们总要看一下里面是什么才进行删除。

 

foreach 循环

//for(集合元素的类型 局部变量 : 集合对象)
    
for(Object obj : coll){
    System.out.println(obj);
}

说明:内部仍然使用了迭代器。【🧐,这是咋知道的,这种情况看不了源码啊?】

一个注意点:这种遍历的方法,那个“集合元素类型”,即使使用泛型定义了具体的集合类型,这里好像也只能写“Object"。🧐【好吧,这个”好像“是错误的,之前的模糊印象,谁让我当时不搞清楚!】

例子如下:

public void test2(){
        ArrayList<Integer> list = new ArrayList<>();
        list.add(1);
        list.add(2);

        for(int i:list){
            System.out.println(i);
        }
    }

使用了泛型,就可以在 foreach 里面用实际的 集合元素类型。

 

 

Collection 子接口—— List 接口

常用方法

增:add(Object obj)

  add(int index, Object ele)

删:remove(int index) / remove(Object obj)

改:set(int index, Object ele)

查:get(int index)

  size()

遍历:

① Iterator迭代器方式

② 增强for循环

③ 普通的循环

 

常用实现类

Collection接口:单列集合,用来存储一个一个的对象

  • List接口:存储序的、可重复的数据。 --> “动态”数组,替换原的数组

    • ArrayList:作为 List 接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储

    • LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储

    • Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储

 

ArrayList 源码分析

jdk 7

ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
list.add(123);//elementData[0] = new Integer(123);
...
list.add(11);//如果此次的添加导致底层elementData数组容量不够,则扩容。

默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中。

结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity)

jdk 8

ArrayList list = new ArrayList();//底层Object[] elementData初始化为{}.并没创建长度为10的数组
list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
...

jdk7中的ArrayList的对象的创建类似于单例的饿汉式,

而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。

 

LinkedList 源码分析

// 内部声明了Node类型的first和last属性,默认值为null,即底层是双向链表
LinkedList list = new LinkedList(); 
list.add(
123);//将123封装到Node中,创建了Node对象。

 

private static class Node<E> { // 其中,Node定义为:体现了LinkedList的双向链表的说法
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
    this.item = element;
    this.next = next;
    this.prev = prev;
    }
}

 

Vector 源码分析

jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组。 在扩容方面,默认扩容为原来的数组长度的2倍。

 

 

Collection 子接口 —— Set 接口

与 List 接口的区别。【🌙:一个东西存在,要问为什么存在?】

List:有序,可重复

Set:无序,不可重复

如何保证这种“不可重复”呢?

👇

元素添加的过程(以 HashSet 为例子)

我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置,判断数组此位置上是否已经元素:

【计算两个东西:1 哈希值,2 索引。🌙:不同的哈希值经过某种算法也可能得出相同的结论】x 不同,有可能 y 同,但是 y 不同,那么 x 肯定不同。这是数学上函数的基本要求。这里的 x 可以指元素,y 则是 哈希值。元素是横坐标,哈希值是纵坐标,因为是 f(元素)= 哈希值。

如果此位置上没其他元素,则元素 a 添加成功。 ---> 情况1

如果此位置上其他元素 b (或以链表形式存在的多个元素,则比较元素a与元素b的hash值:

   如果hash值不相同,则元素 a 添加成功。---> 情况2

   如果hash值相同,进而需要调用元素 a 所在类的equals()方法: 【🧐:哈希值相同代表了什么?因为 hashCode() 可以重写,所以还是不能保证内容相同,所以要进行 equals 比较】

     equals()返回true,元素a添加失败

     equals()返回false,则元素a添加成功。---> 情况3

对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。

jdk 7 :元素a放到数组中,指向原来的元素。

jdk 8 :原来的元素在数组中,指向元素a。

HashSet底层:数组+链表的结构。(前提:jdk7)【🧐what the hell?jdk8咋样的呢?】

 

总结一下:hash值不同的话就可以代表这两个元素不同,但是hash值相同,有可能是“哈希碰撞”、“哈希冲突”现象,所以要继续比较内容,即使用 equals。

 

 

常用实现类

Collection接口:单列集合,用来存储一个一个的对象

  • Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”

    • HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值

    • LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历 在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。对于频繁的遍历操作,LinkedHashSet效率高于HashSet.

    • TreeSet:可以照添加对象的指定属性,进行排序。

 

存储对象所在类的要求

HashSet/LinkedHashSet:

要求:向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals() ( “相等的对象必须具有相等的散列码”。)

要求:重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码

重写两个方法的小技巧:对象中用作 equals() 方法比较的 Field,都应该用来计算 hashCode 值。

TreeSet: 1.自然排序中,比较两个对象是否相同的标准为:compareTo()返回0,不再是equals(). 2.定制排序中,比较两个对象是否相同的标准为:compare()返回0,不再是equals().

 

 

 

TreeSet 的使用

TreeSet 是 SortedSet 接口的实现类,TreeSet 可以确保集合元素处于排序状态。

TreeSet底层使用红黑树结构存储数据。

 

使用注意:

1.向TreeSet中添加的数据,要求是相同类的对象

【🌙,不相同,报错:java.lang.ClassCastException。所以底层到底是咋写的。】

2.两种排序方式:自然排序 和 定制排序,默认情况下使用自然排序。

 1 //方式一:自然排序
 2 @Test
 3     public void test1(){
 4         TreeSet set = new TreeSet();
 5 
 6         set.add(new User("Tom",12));
 7         set.add(new User("Jerry",32));
 8         set.add(new User("Jim",2));
 9 
10         Iterator iterator = set.iterator();
11         while(iterator.hasNext()){
12             System.out.println(iterator.next());
13         }
14 
15     }
16 
17 //方式二:定制排序
18     @Test
19     public void test2(){
20         Comparator com = new Comparator() {
21             //照年龄从小到大排列
22             @Override
23             public int compare(Object o1, Object o2) {
24                 if(o1 instanceof User && o2 instanceof User){
25                     User u1 = (User)o1;
26                     User u2 = (User)o2;
27                     return Integer.compare(u1.getAge(),u2.getAge());
28                 }else{
29                     throw new RuntimeException("输入的数据类型不匹配");
30                 }
31             }
32         };
33 
34         TreeSet set = new TreeSet(com);
35         set.add(new User("Tom",12));
36         set.add(new User("Jerry",32));
37         set.add(new User("Jim",2));
38 
39 
40         Iterator iterator = set.iterator();
41         while(iterator.hasNext()){
42             System.out.println(iterator.next());
43         }
44     }

 

 

Map 接口

 

 

 

常用实现类结构

  • Map:双列数据,存储key-value对的数据 ---类似于高中的函数:y = f(x)

    • HashMap:作为Map的主要实现类;线程不安全的,效率高;存储null的key和value

      • LinkedHashMap:保证在遍历map元素时,可以照添加的顺序实现遍历。 原因:在原的HashMap底层结构基础上,添加了一对指针,指向前一个和后一个元素。 对于频繁的遍历操作,此类执行效率高于HashMap。

    • TreeMap:保证照添加的key-value对进行排序,实现排序遍历。此时考虑key的自然排序或定制排序 底层使用红黑树

    • Hashtable:作为古老的实现类;线程安全的,效率低;不能存储null的key和value

      • Properties:常用来处理配置文件。key和value都是String类型

HashMap的底层:数组+链表 (jdk7及之前)
数组+链表+红黑树 (jdk 8)

 

 

存储结构的理解

Map中的key:无序的、不可重复的,使用Set存储所的key ---> key所在的类要重写equals()和hashCode() (以HashMap为例)

Map中的value:无序的、可重复的,使用Collection存储所的value --->value所在的类要重写equals() 一个键值对:key-value构成了一个Entry对象。

Map中的entry:无序的、不可重复的,使用Set存储所的entry

 

常用方法

添加、删除、修改操作:

Object put(Object key,Object value):将指定key-value添加到(或修改)当前map对象中

void putAll(Map m):将m中的所key-value对存放到当前map中

Object remove(Object key):移除指定key的key-value对,并返回value

void clear():清空当前map中的所数据

元素查询的操作:

Object get(Object key):获取指定key对应的value

boolean containsKey(Object key):是否包含指定的key

boolean containsValue(Object value):是否包含指定的value

int size():返回map中key-value对的个数

boolean isEmpty():判断当前map是否为空

boolean equals(Object obj):判断当前map和参数对象obj是否相等

元视图操作的方法:

Set keySet():返回所key构成的Set集合

Collection values():返回所value构成的Collection集合

Set entrySet():返回所key-value对构成的Set集合

添加:put(Object key,Object value)

删除:remove(Object key)

修改:put(Object key,Object value)

查询:get(Object key)

长度:size()

遍历:keySet() / values() / entrySet()

 

 

内存结构说明

HashMap 在 jdk7 中实现原理:

HashMap map = new HashMap()

在实例化以后,底层创建了长度是16的一维数组Entry[] table。

...可能已经执行过多次

put... map.put(key1,value1)

  首先,调用key1所在类的hashCode()计算key1哈希值,此哈希值经过某种算法计算以后,得到在Entry数组中的存放位置。

  如果此位置上的数据为空,此时的key1-value1添加成功。 ----情况1

  如果此位置上的数据不为空,(意味着此位置上存在一个或多个数据(以链表形式存在)),比较key1和已经存在的一个或多个数据的哈希值:

    如果key1的哈希值与已经存在的数据的哈希值都不相同,此时key1-value1添加成功。----情况2

    如果key1的哈希值和已经存在的某一个数据(key2-value2)的哈希值相同,继续比较:调用key1所在类的equals(key2)方法,比较:

      如果equals()返回false:此时key1-value1添加成功。----情况3

      如果equals()返回true:使用value1替换value2。

补充:关于情况2和情况3:此时key1-value1和原来的数据以链表的方式存储。

在不断的添加过程中,会涉及到扩容问题,当超出临界值(且要存放的位置非空)时,扩容。默认的扩容方式:扩容为原来容量的2倍,并将原的数据复制过来。

 

HashMap在jdk8中相较于jdk7在底层实现方面的不同:

1. new HashMap():底层没创建一个长度为16的数组
2. jdk 8底层的数组是:Node[],而非Entry[]
3. 首次调用put()方法时,底层创建长度为16的数组
4. jdk7底层结构只:数组+链表。jdk8中底层结构:数组+链表+红黑树。
4.1 形成链表时,七上八下(jdk7:新的元素指向旧的元素。jdk8:旧的元素指向新的元素)
4.2 当数组的某一个索引位置上的元素以链表形式存在的数据个数 > 8 且当前数组的长度 > 64时,此时此索引位置上的所数据改为使用红黑树存储。

HashMap底层典型属性的属性的说明:
DEFAULT_INITIAL_CAPACITY : HashMap的默认容量,16
DEFAULT_LOAD_FACTOR:HashMap的默认加载因子:0.75
threshold:扩容的临界值,=容量*填充因子:16 * 0.75 => 12
TREEIFY_THRESHOLD:Bucket中链表长度大于该默认值,转化为红黑树:8
MIN_TREEIFY_CAPACITY:桶中的Node被树化时最小的hash表容量:64

 

LinkedHashMap的底层实现原理(了解)

LinkedHashMap底层使用的结构与HashMap相同,因为LinkedHashMap继承于HashMap.
区别就在于:LinkedHashMap内部提供了Entry,替换HashMap中的Node.

HashMap 中的内部类:Node

[插入代码]

LinkedHashMap 中的内部类:Entry

[插入代码]

 

TreeMap的使用

//向TreeMap中添加key-value,要求key必须是由同一个类创建的对象
//因为要照key进行排序:自然排序 、定制排序

 

使用Properties读取配置文件

//Properties:常用来处理配置文件。key和value都是String类型
public static void main(String[] args)  {
    FileInputStream fis = null;
    try {
        Properties pros = new Properties();

        fis = new FileInputStream("jdbc.properties");
        pros.load(fis);//加载流对应的文件

        String name = pros.getProperty("name");
        String password = pros.getProperty("password");

        System.out.println("name = " + name + ", password = " + password);
    } catch (IOException e) {
        e.printStackTrace();
    } finally {
        if(fis != null){
            try {
                fis.close();
            } catch (IOException e) {
                e.printStackTrace();
            }

        }
    }

 

 

Collection 工具类的使用

常用方法

reverse(List):反转 List 中元素的顺序
shuffle(List):对 List 集合元素进行随机排序
sort(List):根据元素的自然顺序对指定 List 集合元素升序排序
sort(List,Comparator):根据指定的 Comparator 产生的顺序对 List 集合元素进行排序
swap(List,int, int):将指定 list 集合中的 i 处元素和 j 处元素进行交换
Object max(Collection):根据元素的自然顺序,返回给定集合中的最大元素
Object max(Collection,Comparator):根据 Comparator 指定的顺序,返回给定集合中的最大元素
Object min(Collection)
Object min(Collection,Comparator)
int frequency(Collection,Object):返回指定集合中指定元素的出现次数
void copy(List dest,List src):将src中的内容复制到dest中
boolean replaceAll(List list,Object oldVal,Object newVal):使用新值替换 List 对象的所旧值

 

说明:ArrayList和HashMap都是线程不安全的,如果程序要求线程安全,我们可以将ArrayList、HashMap转换为线程的。
使用synchronizedList(List list) 和 synchronizedMap(Map map)

 

 

posted @ 2021-05-23 10:58  就叫小月亮  阅读(132)  评论(0)    收藏  举报