Java批量更新太慢?多线程+List分段完美解决!

程序员的成长之路

共 4240字,需浏览 9分钟

 · 2022-06-21

程序员的成长之路
互联网/程序员/技术/资料共享 
关注


阅读本文大概需要 2.8 分钟。

作者:ADAMs.

来源:blog.csdn.net/qq_43097201/article/details/112452391


# 写在前面:


相信不少开发者在遇到项目对数据进行批量操作的时候,都会有不少的烦恼,尤其是针对数据量极大的情况下,效率问题就直接提上了菜板。


因此,开多线程来执行批量任务是十分重要的一种批量操作思路,其实这种思路实现起来也十分简单,就拿批量更新的操作举例:

# 整体流程图



# 步骤


  • 获取需要进行批量更新的大集合A,对大集合进行拆分操作,分成N个小集合A-1 ~ A-N 。

  • 开启线程池,针对集合的大小进行调参,对小集合进行批量更新操作。

  • 对流程进行控制,控制线程执行顺序。

# 按照指定大小拆分集合的工具类
import com.google.common.collect.Lists;import org.apache.commons.collections.CollectionUtils;
import java.util.List;
/** * 拆分结合工具类 * * @author shiwen * @date 2020/12/27 */public class SplitListUtils { /** * 拆分集合 * * @param <T> 泛型对象 * @param resList 需要拆分的集合 * @param subListLength 每个子集合的元素个数 * @return 返回拆分后的各个集合组成的列表 * 代码里面用到了guava和common的结合工具类 **/ public static <T> List<List<T>> split(List<T> resList, int subListLength) { if (CollectionUtils.isEmpty(resList) || subListLength <= 0) { return Lists.newArrayList(); } List<List<T>> ret = Lists.newArrayList(); int size = resList.size(); if (size <= subListLength) { // 数据量不足 subListLength 指定的大小 ret.add(resList); } else { int pre = size / subListLength; int last = size % subListLength; // 前面pre个集合,每个大小都是 subListLength 个元素 for (int i = 0; i < pre; i++) { List<T> itemList = Lists.newArrayList(); for (int j = 0; j < subListLength; j++) { itemList.add(resList.get(i * subListLength + j)); } ret.add(itemList); } // last的进行处理 if (last > 0) { List<T> itemList = Lists.newArrayList(); for (int i = 0; i < last; i++) { itemList.add(resList.get(pre * subListLength + i)); } ret.add(itemList); } } return ret;    }
// 运行代码 public static void main(String[] args) { List<String> list = Lists.newArrayList(); int size = 1099; for (int i = 0; i < size; i++) { list.add("hello-" + i); } // 大集合里面包含多个小集合 List<List<String>> temps = split(list, 100); int j = 0; // 对大集合里面的每一个小集合进行操作 for (List<String> obj : temps) { System.out.println(String.format("row:%s -> size:%s,data:%s", ++j, obj.size(), obj)); } }
}
开启异步执行任务的线程池
public void threadMethod() { List<T> updateList = new ArrayList(); // 初始化线程池, 参数一定要一定要一定要调好!!!! ThreadPoolExecutor threadPool = new ThreadPoolExecutor(20, 50, 4, TimeUnit.SECONDS, new ArrayBlockingQueue(10), new ThreadPoolExecutor.AbortPolicy()); // 大集合拆分成N个小集合, 这里集合的size可以稍微小一些(这里我用100刚刚好), 以保证多线程异步执行, 过大容易回到单线程 List<T> splitNList = SplitListUtils.split(totalList, 100); // 记录单个任务的执行次数 CountDownLatch countDownLatch = new CountDownLatch(splitNList.size()); // 对拆分的集合进行批量处理, 先拆分的集合, 再多线程执行 for (List<T> singleList : splitNList) { // 线程池执行 threadPool.execute(new Thread(new Runnable(){ @Override public void run() { for (Entity yangshiwen : singleList) { // 将每一个对象进行数据封装, 并添加到一个用于存储更新数据的list // ...... } } })); // 任务个数 - 1, 直至为0时唤醒await() countDownLatch.countDown(); } try { // 让当前线程处于阻塞状态,直到锁存器计数为零 countDownLatch.await(); } catch (InterruptedException e) { throw new BusinessLogException(ResponseEnum.FAIL); } // 通过mybatis的批量插入的方式来进行数据的插入, 这一步还是要做判空 if (GeneralUtil.listNotNull(updateList)) { batchUpdateEntity(updateList); LogUtil.info("xxxxxxxxxxxxxxx"); }}

# 写在最后


多线程是Java的一个难点,但是它也很有趣,听说玩得溜得起飞的人,人生都开启多线程模式了…
<END>

推荐阅读:

Java8 Lambda 表达式中的 forEach 如何提前终止?

20 个最常用的 Git 命令,你都会用吗?

互联网初中高级大厂面试题(9个G)

内容包含Java基础、JavaWeb、MySQL性能优化、JVM、锁、百万并发、消息队列、高性能缓存、反射、Spring全家桶原理、微服务、Zookeeper......等技术栈!

戳阅读原文领取!                                  朕已阅 

浏览 9
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报