CRUD工程师常见问题——List遍历过慢
遍历方式主要有
1.传统的for循环遍历,基于计数器的:遍历者自己在集合外部维护一个计数器,然后依次读取每一个位置的元素,当读取到一最后一个元素后,停止。主要是需要按元素的位置来读取。这也是最原始的集合遍历方法。
for (int i = 0; i < list.size(); i++) { list.get(i); }
2.迭代器遍历:Iterator本来是OO的一个设计模式,主要目的是屏蔽不同数据集合的特点,统一遍历集合的接口。Java作为一个OO语言,自然也在Collections中支持了Iterator模式。相比于传统for循环,Iterator取缔了显式的遍历计数器。所以基于存储集合的Iterator可以直接按位置访问数据。而基于链式存储集合的Iterator,正常的实现,都是需要保持当前遍历的位置。然后根据当前位置来向前或者向后移动指针。
Iterator iterator = list.iterator(); while (iterator.hasNext()) { iterator.next(); }
3.foreach 循环遍历:屏蔽了显式声明的Iterator和计数器。内部也是采用了Iterator的方式实现,只不过Java编译器帮我们生成了这些代码
for (Object object : list) { System.out.println(object); }
各遍历方式的适用于什么场合?
1.传统的for循环遍历,基于计数器的:
顺序存储:读取性能比较高。适用于遍历顺序存储集合。
链式存储:时间复杂度太大,不适合遍历链式存储的集合。
2.迭代器遍历,Iterator:
顺序存储:如果不是太在意时间,推荐选择此方式,毕竟代码更加简洁,也防止了Off-By-One的问题。
链式存储:意义就重大了,平均时间复杂度降为O(n),还是挺诱人的,所以推荐这种方式遍历。
3.foreach循环遍历:
foreach只是让代码更加简洁了,但是他有一些缺点,就是遍历过程中,不能操作数据集合(删除等),所以有些场合不适用,而且它本身就是基于Iterator实现的,但是由于类型住转换委托,所以会比直接使用Iterator慢一点,但是还好,时间复杂度都是一样的。
网上看了很多,基本的解决方法
1.多线程,使用线程进行遍历,然后另外一个去做操作
2.如果去嵌套的可以在第二轮对其他表查询的时候 使用Map
3.如果是唯一的,可以使用HashSet
5.一般情况下List的底层是数组,已经很快了,优化的部分可以把重心放在遍历后的处理上