并行执行

   /**
     * 并行执行
     * @param ids
     * @param func
     * @param <T>
     * @return
     */
    public static  <R,T> List<R> parallel(List<T> ids, Function<List<T>, List<R>> func) {
        List<List<T>> idGroups = Lists.partition(ids, 1000);  /////将list集合按指定长度进行切分，返回新的List<List<??>>集合，如下的：List<List<Integer>> lists=Lists.partition(numList,3);

// List<Integer> numList = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8);
// List<List<Integer>> lists=Lists.partition(numList,3);
// System.out.println(lists);//[[1, 2, 3], [4, 5, 6], [7, 8]]


 
        ExecutorService executor = Executors.newFixedThreadPool(idGroups.size());   //创建 idGroups.size() 个线程池

        try{
            CompletableFuture<List<List<R>>> futures = idGroups
                    .stream()
                    .collect(ParallelCollectors
                            .parallelToList(i -> func.apply(i), executor, idGroups.size()));

            List<R> result= futures.join()
                    .stream()
                    .flatMap(Collection::stream)
                    .collect(toList());

            return  result;
        }finally {
            executor.shutdown();
        }
    }

    /**
     * 将数据分割执行指定方法
     * @param data
     * @param consumer
     * @param <T>
     */
    public static <T> void partitionInvoke(List<T> data, Consumer<List<T>> consumer) {
        List<List<T>> items = Lists.partition(data, 1000);
        for (List<T> item : items) {
            consumer.accept(item);
        }
    }

java.lang.StackOverflowError解决
osc_v9ujioxy
2019/11/01 09:58
阅读数 479
在使用JPA的仓储repository进行查询时，经常用到findAllbyId的方法： repository.findAllbyId()

但如果像下面的代码，当list的size量太大的话，就会报栈溢出的的错误：java.lang.StackOverflowError

@RequestMapping("/stackOverFlow")
    public Integer stackOverFlow() {

        List<String> ids = new ArrayList<>();
        for (int i = 0; i < 5000; i++) {
            ids.add("123123123123");
        }
        List<BillDO> allById = dwBillRepository.findAllById(ids);

        return allById.size();
    }
报错信息如下：

Caused by: java.lang.StackOverflowError
    at antlr.BaseAST.toString(BaseAST.java:333) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:341) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
    at antlr.BaseAST.toStringList(BaseAST.java:347) ~[antlr-2.7.7.jar:?]
原因就是在拼sql时方法入栈太深，超过了jvm允许的最大深度，也就是递归调用的太深了。

public String toStringList() {
        String var2 = "";
        if (this.getFirstChild() != null) {
            var2 = var2 + " (";
        }

        var2 = var2 + " " + this.toString();
        if (this.getFirstChild() != null) {
            var2 = var2 + ((BaseAST)this.getFirstChild()).toStringList();
        }

        if (this.getFirstChild() != null) {
            var2 = var2 + " )";
        }

        if (this.getNextSibling() != null) {
            var2 = var2 + ((BaseAST)this.getNextSibling()).toStringList();
        }

        return var2;
    }
 

解决方法就是不要递归的太深。或者调整JVM参数栈大小默认为1m,可以调整到10m,看看不能解决问题，但这样做不推荐。会影响线程数，从而影响系统性能。

具体到上面的问题就是一次不要查太多的数据。如果in的数量有5000，我们就分开查询一次只查1000，查5次。再把结果组合在一起。

如果每个业务都单独写的话，就太麻烦了，可以写个公共的方法，如下： JPA_QUERY_LIST_MAX_SIZE是一个常量数据值，如1000个查一次。这里使用了并行查询，查询效率更高。

public <T> List<T> findAll(List<String> ids, Function<List<String>, List<T>> func) {

        List<List<String>> idGroups = Lists.partition(ids, JPA_QUERY_LIST_MAX_SIZE);
ThreadPoolExecutor executor = (ThreadPoolExecutor) Executors.newFixedThreadPool(idGroups.size());
        executor.setKeepAliveTime(10, TimeUnit.SECONDS);//解决线程不退出的问题
        executor.allowCoreThreadTimeOut(true);


return idGroups
                .stream()
                .collect(ParallelCollectors
                        .parallelToList(i -> func.apply(i), executor, idGroups.size()))
                .join()
                .stream()
                .flatMap(Collection::stream)
                .collect(toList());
    }
以上代码利用如一个第三方的库：需要引用:

<dependency>
            <groupId>com.pivovarit</groupId>
            <artifactId>parallel-collectors</artifactId>
            <version>1.1.0</version>
        </dependency>

posted @ 2021-02-08 14:06 abcdefghijklmnop 阅读(145) 评论(0) 收藏举报

刷新页面返回顶部

kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk

并行执行

公告