网站开发流程图 最,网站构建的基本流程,wordpress 加载文件太多,seo优化提升排名欢迎关注公众号#xff08;通过文章导读关注#xff1a;【11来了】#xff09;#xff0c;及时收到 AI 前沿项目工具及新技术的推送#xff01; 在我后台回复 「资料」 可领取编程高频电子书#xff01; 在我后台回复「面试」可领取硬核面试笔记#xff01; 文章导读地址… 欢迎关注公众号通过文章导读关注【11来了】及时收到 AI 前沿项目工具及新技术的推送 在我后台回复 「资料」 可领取编程高频电子书 在我后台回复「面试」可领取硬核面试笔记 文章导读地址点击查看文章导读 感谢你的关注 京东并行框架asyncTool如何针对高并发场景进行优化 由于最近在整理并发相关的内容整理了 CompletableFuture、CAS、线程池这些方面的内容但是通过理论知识我们只是学会了怎么去用应该怎么去用
但是并没有学习别人如何去用没有实际场景的示范恰巧看到了 tianyaleixiaowu 作者开源出来的 asyncTool 并行框架 并且已经在 京东App后台接受苛刻、高并发、海量用户等复杂场景业务的检验测试
所以这篇文章就以这个并行框架为例来说一下如何在高并发场景中保证比较好的性能即如何通过 CompletableFuture、CAS、线程池去提升性能表现
asyncTool 介绍及使用
首先介绍一下这个框架的作用主要是用来进行一些并行任务的编排的以及任务执行时的一些监控和回调
那么你可能会想了不是有 CompletableFuture 来做任务编排呢为什么还需要这个框架
这个作者也说了CompletableFuture 虽然提供了任务编排的能力但是尚有不足比如我们有多个任务并对他们编排但是我们想要 了解每个任务在开始执行以及执行结束的情况 对这些情况进行监控那么在这种情况下 CompletableFuture 就无能为力了
这里我们举一个简单的使用例子有 3 个任务需要执行完 task1 之后再执行 task2执行完 task2 之后再执行 task3流程如下 接下来定义任务需要实现 IWorker、ICallback 两个接口主要是定义其中的回调以及任务执行方法这里可以不用具体了解毕竟我们主要是看它是如何使用线程池的只需要知道这个 MyTask1 是我们需要执行的任务即可 接下来我们定义测试类这里使用了 3 个任务只需要将上边定义的 MyTask1 再复制两份即可 在这个测试类中创建了 3 个任务实例并且定义了 3 个 WorkerWrapper 包装类这个 Wrapper 主要对要执行的任务进行 包装、编排 比如我们定义了 workerWrapper1 并通过 next 方法指定下一个执行的任务是 workerWrapper2 通过 next 进行任务的编排
最后通过 Async.beginWork() 来提交任务即可接下来核心就看 asyncTool 是如何执行任务的
CompletableFuture 和线程池配合使用
上边说如何使用主要是为了找到任务开始执行的入口从 入口 开始看框架对于任务的处理 从入口进入最后走到下边这个 核心方法 中 在这个方法中可以看到是定义了一个 CompletableFuture 数组 来存储任务的异步执行结果
之后将我们定义的任务都扔到 线程池 中来执行来将任务进行异步执行提升任务执行速度最后通过通过 CompletableFuture.allOf().get() 来阻塞等待所有任务执行完毕最后返回即可
可以看到在执行一些耗时操作中异步化基本上都是必备的操作也就是通过 CompletableFuture 和 线程池 来搭配使用将任务的耗时操作异步化出去尽量不影响主干流程
线程池的定义
上边说到了 asyncTool 中将 CompletableFuture 和 线程池 搭配使用线程池具体如何定义的呢这里其实使用了 newCachedThreadPool 线程池具体的参数定义如下 可以发现该线程池中并没有设置 核心线程 并且 线程的存活时间设置为 60s 任务队列使用了 SynchronousQueue 任务队列为什么要使用这个线程池呢
先从场景来看这个 asyncTool 框架主要是对提交的并行任务进行编排执行的但是该框架其实并不知道任务什么时候会去提交以及任务的数量大小的
所以在 asyncTool 中对于默认线程池的线程数量的设置就没有一个合适的值如果设置的少了可能任务提交多了之后 导致任务堆积 OOM 如果设置的多了很多线程就会一直空闲比较浪费线程资源
因此呢就不设置核心线程将最大线程数设置为 Integer.MAX_VALUE 并且要与任务队列 SynchronousQueue 搭配使用
因为线程池的工作流程其实是先来判断有没有核心线程没有核心线程的话会将任务提到任务队列中阻塞等待而 SynchronousQueue 这个任务队列是没有容量的只做任务传递的作用因此任务不会阻塞在队列中直接会创建非核心线程执行任务如果使用了 有容量的任务队列 就会出现问题了当任务提交到任务队列之后此时没有核心线程任务会一直在任务队列中阻塞得不到执行
线程池参数这样设置的好处
当没有任务的时候线程池中不需要再维护核心线程的存活可以节约线程资源
当有任务提交的时候线程池会根据任务的数量来创建对应的线程数量执行任务这样就不会因为线程数设置过多或者过少而出现一些问题了
CAS 的使用
asyncTool 框架的目的就是编排并行任务的执行那么既然是并行任务肯定要保证多线程环境下任务不会重复执行这些情况出现
在 asyncTool 中并没有使用 synchronized 以及 ReentrantLock 这些比较重量级的锁而是使用 CAS 来保证任务不会重复执行
这里看一下在这个框架中任务真正被执行时的代码如何来保证任务不被重复执行的为了重点代码清晰省略了一部分非核心代码 可以看到在真正执行任务之前会先通过 CAS 来判断任务的状态是否是 INIT 是的话表示任务还没有被执行如果不是的话说明已经被执行过了或者任务出现了异常这里直接返回结果就好了
如果 CAS 操作失败说明任务的状态并不是 INIT 任务已经开始执行了所以这里就不要重复执行了
并且在执行完任务之后再次通过 CAS 操作判断任务状态如果已经不是 WORKING 说明其他线程已经执行完该任务了或者其他线程在执行时发现任务出现异常因此这里就直接返回了避免在后边重复的进行任务回调操作
为什么说 CAS 操作比较轻量呢
这个如果了解 synchronized 的锁升级流程的话应该就知道为什么
在 synchronized 锁升级的过程中轻量级锁就是通过 CAS 来获取锁的而重量级锁是通过 线程的阻塞、唤醒 进行线程之间的获取锁操作
那么 CAS 操作性能就高在了它只需要去内存中进行值的比对发现内存的值和期望值不同就直接返回操作失败就可以了
如果在 asyncTool 中使用 synchronized 来保证线程之间的同步的话这还需要进行线程之间的阻塞、唤醒操作因此会出现线程之间的上下文切换以及用户态和内核态之间的转换导致性能开销比较大
所以在 asyncTool 不去对线程同步进行控制而是通过 CAS 来避免一些因为重复操作可能会带来的问题这样性能就比较高了
asyncTool 开源框架项目地址 https://gitee.com/jd-platform-opensource/asyncTool
如果需要测试代码的话可以从我 fork 的仓库中拉取https://gitee.com/qylaile/asyncTool