List与Set的contains方法效率问题

List与Set的contains方法效率问题

 
  1. 学生选了的课中包含了常用算法这门课程,从代码中可以看到,新建了一个名字叫常用算法的课程与Set中的课程比较,看是否包含,很明显跟List的测试一样,课程名字一样,但是输出却是false。
  2. 那Set中的contains()方法的原理是什么?能确定的是跟List的不一样,因为在List中已经重写了equals()方法,若Set的contains()原理与List的相同,那么这里的结果应该是true,但是这里是false。
  3. 原来,在Object类中除了定义equals()方法,还定义了hashCode()的方法,返回的是对象的哈希码(哈希码是对象的内存地址字符串,对象不同,内存地址就不同,哈希码就不同)。当我们调用Set的contains()方法时,会先调用每个元素的hashCode()方法,如果返回的值与比较对象相同,再调用equals()方法,只有在这两个方法的值都相等的情况下,才可认定这个Set包含某个元素。
  4. 因此在测试中新建了对象,哈希码当然会不同,所以就算重写了equals()方法,得到的结果还是false。要使其输出是true,要在Course.java中重写hashCode()方法,配合之前重写的equals()方法,就能达到目的。

今天看到网上一篇文章说:Set检索元素效率低下,删除和插入效率高;List查找元素效率高,插入删除元素效率低。于是想到List虽然用get(index)方法查询效率高,但是若用contains方法查询对象元素,Set集合应该比List效率要高,下面是实验证明操作过程。

实体类:

 Student

准备数据代码:

复制代码
List<Student> list = new ArrayList<Student>();
        Set<Student> set = new HashSet<Student>();
        Student s = null;
        for(int i = 0; i <= 100000; i++){
            s = new Student("name"+i,"addr"+i);
            list.add(s);
            set.add(s);
        }
复制代码

 

查询第一个对象:

 代码:

复制代码
long start = System.currentTimeMillis();
        Student stu = new Student("name0","addr0");
        System.out.println(list.contains(stu));
//        System.out.println(set.contains(stu));
        long end = System.currentTimeMillis();
        System.out.println("查询对象 "+stu.toString()+"\n共耗费时间:"+(end-start)+ "毫秒");
复制代码

使用ArrayList查询结果结果:

使用HashSet查询结果:

查询第一个对象太简单了,它们都几乎不用花时间...

查询靠后的对象:

代码:

复制代码
        long start = System.currentTimeMillis();
        Student stu = new Student("name100000","addr100000");
//        System.out.println(list.contains(stu));
        System.out.println(set.contains(stu));
        long end = System.currentTimeMillis();
        System.out.println("查询对象 "+stu.toString()+"\n共耗费时间:"+(end-start)+ "毫秒");
复制代码

使用ArrayList查询结果结果:

使用HashSet查询结果:

 HashSet快一些。。。

通过多次调用contains方法分别查询开头到结尾所有对象:

代码:

复制代码
long start = System.currentTimeMillis();
        for(int i = 0; i<= 100000; i++){
            s = new Student("name"+i,"addr"+i);
            System.out.println(i+"__"+list.contains(s));
//        System.out.println(i+"__"+set.contains(s));
        }
        
        long end = System.currentTimeMillis();
        System.out.println("查询10000个对象 \n共耗费时间:"+(end-start)+ "毫秒");
复制代码

 

使用ArrayList查询结果结果:;使用HashSet查询结果:

耗时前者是后者的167.46倍(打印代码中把100000写成10000了,但是不影响结果)

 总结:使用contains方法查询元素是否存在HashSet要比ArrayList快的多。

posted on 2018-07-03 17:01  小小野马  阅读(9135)  评论(0编辑  收藏  举报