Java基础复习18

十八、Java容器

1.集合与数组

  集合、数组都是对多个数据进行存储操作的结构,简称Java容器
  数组在存储多个数据方面的缺点:
    一旦初始化以后,其长度就不可修改。
    数组中提供的方法非常有限,对于添加、删除、插入数据等操作,非常不便,同时效率不高
    获取数组中实际元素的个数的需求,数组没有现成的属性或方法可用
    数组存储数据的特点:有序、可重复。对于无序、不可重复的需求,不能满足

2.集合框架

  集合框架分为两大块:Collection接口和Map接口
    |----Collection接口:单列集合,用来存储一个一个的对象
      |----List接口:存储有序的、可重复的数据。 -->“动态”数组
        |----ArrayList、LinkedList、Vector

      |----Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
        |----HashSet、LinkedHashSet、TreeSet

    |----Map接口:双列集合,用来存储一对(key - value)一对的数据 -->高中函数:y = f(x)
      |----HashMap、LinkedHashMap、TreeMap、Hashtable、Properties

3.Collection接口中的方法的使用

  Collection coll = new ArrayList();
    coll.add(Object e):将元素e添加到集合coll中
    coll.size():获取添加的元素的个数
    coll.addAll(Collection coll1):将coll1集合中的元素添加到当前的集合中
    coll.clear():清空集合元素
    coll.isEmpty():判断当前集合是否为空

    coll.contains(Object obj):判断当前集合中是否包含obj //我们在判断时会调用obj对象所在类的equals(),向Collection接口的实现类的对象中添加数据obj时,要求obj所在类要重写equals()
    coll.containsAll(Collection coll1):判断形参coll1中的所有元素是否都存在于当前集合中
    coll.remove(Object obj):从当前集合中移除obj元素 //注意该方法在List的实现类中有一个同名的重载方法,后边会提
    coll.removeAll(Collection coll1):差集:从当前集合中移除coll1中所有的元素
    coll.retainAll(Collection coll1):交集:获取当前集合和coll1集合的交集,并返回给当前集合
    coll.equals(Object obj):要想返回true,需要当前集合和形参集合的元素都相同
    coll.hashCode():返回当前对象的哈希值
    集合 --->数组:coll.toArray()
    拓展:数组 --->集合:调用Arrays类的静态方法asList() //Arrays.asList(new String[]{"AA","BB"});
    coll.iterator():返回Iterator接口的实例,用于遍历集合元素

4.集合元素的遍历

  推荐使用的迭代器方式
  hasNext():判断是否还有下一个元素
  while(iterator.hasNext()){
    //next():①指针下移 ②将下移以后集合位置上的元素返回
    System.out.println(iterator.next());
  }

  每次调用集合.iterator()方法得到的下标都是从头开始

  jdk5.0新增了foreach循环,用于遍历集合、数组
  //for(集合元素的类型 局部变量 : 集合对象)
  //内部仍然调用了迭代器。
  for(Object obj : coll){
    System.out.println(obj);
  }
  注意:这里的遍历方式,是将coll集合里的元素赋给obj,然后输出obj
  而对于字符串来说,它是不可变序列,对字符串的修改操作只会在方法区的字符串常量池中创建新的字符串,原字符串不改变
  String[] arr = new String[]{"MM","MM","MM"}
  for(String s : arr){
    s = "GG";
  }

  for(int i = 0;i < arr.length;i++){
    System.out.println(arr[i]); //打印出来的还是MM,因为是将集合中的元素赋给了s,s进行修改不影响原元素
  }

5.List接口框架

  |----Collection接口:单列集合,用来存储一个一个的对象
    |----List接口:存储有序的、可重复的数据。 -->“动态”数组,替换原有的数组
      |----ArrayList:作为List接口的主要实现类;线程不安全的,效率高;底层使用Object[] elementData存储
      |----LinkedList:对于频繁的插入、删除操作,使用此类效率比ArrayList高;底层使用双向链表存储
      |----Vector:作为List接口的古老实现类;线程安全的,效率低;底层使用Object[] elementData存储

6.List源码分析

  jdk7情况下
  ArrayList list = new ArrayList();//底层创建了长度是10的Object[]数组elementData
  list.add(123);//elementData[0] = new Integer(123);
  ...
  list.add(11);//如果此次的添加导致底层elementData数组容量不够,则扩容。
  默认情况下,扩容为原来的容量的1.5倍,同时需要将原有数组中的数据复制到新的数组中 //copyOf()方法

  结论:建议开发中使用带参的构造器:ArrayList list = new ArrayList(int capacity) //避免扩容复制数组的问题

  jdk8中ArrayList的变化:
  ArrayList list = new ArrayList();//底层Object[] elementData初始化为{}.并没有创建长度为10的数组
  list.add(123);//第一次调用add()时,底层才创建了长度10的数组,并将数据123添加到elementData[0]
  ...
  后续的添加和扩容操作与jdk 7 无异。

  小结:jdk7中的ArrayList的对象的创建类似于单例的饿汉式,而jdk8中的ArrayList的对象的创建类似于单例的懒汉式,延迟了数组的创建,节省内存。

  LinkedList的源码分析:
  LinkedList list = new LinkedList(); 内部声明了Node类型的first和last属性,默认值为null
  list.add(123);//将123封装到Node中,创建了Node对象。
  其中,Node定义为:体现了LinkedList的双向链表的说法
  private static class Node<E> {
    E item;
    Node<E> next;
    Node<E> prev;

    Node(Node<E> prev, E element, Node<E> next) {
      this.item = element;
      this.next = next;
      this.prev = prev;
    }
  }

  Vector的源码分析:jdk7和jdk8中通过Vector()构造器创建对象时,底层都创建了长度为10的数组。
  在扩容方面,默认扩容为原来的数组长度的2倍。

7.List的常用方法

  //因为ArrayList底层用Object[]存储,所以理所应当能支持下标形式
  void add(int index, Object ele):在index位置插入ele元素
  boolean addAll(int index, Collection eles):从index位置开始将eles中的所有元素添加进来
  Object get(int index):获取指定index位置的元素
  int indexOf(Object obj):返回obj在集合中首次出现的位置
  int lastIndexOf(Object obj):返回obj在当前集合中末次出现的位置
  Object remove(int index):移除指定index位置的元素,并返回此元素 //注意该方式是一个重载方法,还有一个从Collection接口中重写的remove()方法
  Object set(int index, Object ele):设置指定index位置的元素为ele
  List subList(int fromIndex, int toIndex):返回从fromIndex到toIndex位置的子集合

  总结:常用方法
  增:add(Object obj)
  删:remove(int index) / remove(Object obj)
  改:set(int index, Object ele)
  查:get(int index)  
  插:add(int index, Object ele)
  长度:size()
  遍历:① Iterator迭代器方式
        ② 增强for循环
        ③ 普通的循环

8.Set接口的框架

  |----Collection接口:单列集合,用来存储一个一个的对象
    |----Set接口:存储无序的、不可重复的数据 -->高中讲的“集合”
      |----HashSet:作为Set接口的主要实现类;线程不安全的;可以存储null值
        |----LinkedHashSet:作为HashSet的子类;遍历其内部数据时,可以按照添加的顺序遍历
      对于频繁的遍历操作,LinkedHashSet效率高于HashSet.
      |----TreeSet:可以按照添加对象的指定属性,进行排序

9.Set源码分析

  存储无序的、不可重复的数据

  1.无序性:不等于随机性。存储的数据在底层数组中并非按照数组索引的顺序添加,而是根据数据的哈希值决定的。
  //它本身其实还是用数组实现的,只不过这次它的元素放入顺序不是按照从0到最后开始了,而是通过哈希值经过一定的算法(例如考研学过的除留取余法)计算出每个的余数,数组长度为16,%16后得到的值就是它的索引值,放入
  2.不可重复性:保证添加的元素按照equals()判断时,不能返回true.即:相同的元素只能添加一个。

  添加元素的过程:以HashSet为例:
    我们向HashSet中添加元素a,首先调用元素a所在类的hashCode()方法,计算元素a的哈希值,
    此哈希值接着通过某种算法计算出在HashSet底层数组中的存放位置(即为:索引位置),判断数组此位置上是否已经有元素:
      如果此位置上没有其他元素,则元素a添加成功。 --->情况1
      如果此位置上有其他元素b(或以链表形式存在的多个元素),则比较元素a与元素b的hash值:
        如果hash值不相同,则元素a添加成功。--->情况2
        如果hash值相同,进而需要调用元素a所在类的equals()方法:
          equals()返回true,元素a添加失败
          equals()返回false,则元素a添加成功。--->情况3

  对于添加成功的情况2和情况3而言:元素a 与已经存在指定索引位置上数据以链表的方式存储。
  jdk 7 :元素a放到数组中,指向原来的元素。
  jdk 8 :原来的元素在数组中,指向元素a
  总结:七上八下

  HashSet底层:数组+链表的结构
  正因为Set中的无序性和不可重复性,每次进去都要比看是否相同保证不重复,若要循环的一个一个太浪费时间,所以用了哈希值的方法,而这种方法就要求了每个要放进去的对象所在类都要重写hashCode()方法,不然默认调用Object类中的hashCode()方法,返回的值都不相同,这样对于同一个类创建的属性相同的对象来说,他们的哈希值肯定不相同,那么在放入Set的过程中,总会找到一个没有放值的地方,就破坏了不重复性,另外即使他们的哈希值相同了,都放在了同一个地方,还要看他们是否相等,所以要调用equals()方法,这也要求所放对象的类重写equals()方法,不然调用Object类中的equals()方法比的又是地址了
  总结:向Set(主要指:HashSet、LinkedHashSet)中添加的数据,其所在的类一定要重写hashCode()和equals()
  重写的hashCode()和equals()尽可能保持一致性:相等的对象必须具有相等的散列码
  重写两个方法的小技巧:对象中用作 equals()方法比较的Field,都应该用来计算hashCode值

10.LinkedHashSet的使用

  LinkedHashSet作为HashSet的子类,在添加数据的同时,每个数据还维护了两个引用,记录此数据前一个数据和后一个数据。
  优点:对于频繁的遍历操作,LinkedHashSet效率高于HashSet
  注意:HashSet于LinkedHashSet都是无序的,只是在LinkedHashSet中看起来是有序的了,但是它的底层存储过程仍然是无序的,只是用两个指针指向了前驱和后继,显得有序了而已,这里的无序性指的是它的底层存储过程是无序的

11.TreeSet

  向TreeSet中添加的数据,要求是相同类的对象。
  两种排序方式:自然排序(实现Comparable接口) 和 定制排序(Comparator)
  自然排序中,比较两个对象是否相同的标准为:compareTo()返回0.不再是equals()
  定制排序中,比较两个对象是否相同的标准为:compare()返回0.不再是equals()
  所以在放入TreeSet集合中,判断其是否相同的标准变了,比如HashSet中使用hashCode()和equals()方法,TreeSet使用的是Comparable和Comparator接口
  注意:TreeSet底层实现是红黑树

posted @ 2021-03-27 20:56  天真爱吃肉  阅读(52)  评论(0)    收藏  举报