0

0

在Loom中利用虚拟线程实现递归任务:告别ForkJoinPool的限制

聖光之護

聖光之護

发布时间:2025-10-09 13:27:48

|

905人浏览过

|

来源于php中文网

原创

在Loom中利用虚拟线程实现递归任务:告别ForkJoinPool的限制

本文探讨了Java Loom中RecursiveAction和RecursiveTask与虚拟线程的兼容性。由于它们设计上依赖于ForkJoinPool及其特定的工作线程,无法直接与虚拟线程配合使用。文章提供了两种替代方案:一是利用CompletableFuture结合虚拟线程工厂实现自定义递归任务,二是介绍孵化阶段的StructuredTaskScope API,以更结构化的方式管理并发子任务。这些方法允许开发者在虚拟线程环境下高效地执行递归分解任务,同时避免了传统ForkJoinPool的限制。

RecursiveAction与RecursiveTask不兼容虚拟线程的原因

recursiveaction和recursivetask是java并发api中用于支持分治算法的抽象基类,它们专为forkjoinpool设计。正如其文档所述,它们是“在forkjoinpool中运行任务的抽象基类”。forkjoinpool虽然允许通过线程工厂进行定制,但它要求的是forkjoinpool.forkjoinworkerthreadfactory接口的实现,用于生产forkjoinworkerthread实例。

ForkJoinWorkerThread是Thread的子类,这意味着它们是平台线程(Platform Thread)的特化。虚拟线程(Virtual Thread)则是一种轻量级的线程,由Thread.Builder.OfVirtual创建,与传统的平台线程在实现机制上存在根本差异。因此,ForkJoinPool无法通过其内部的线程工厂机制来创建或使用虚拟线程。这意味着,RecursiveAction和RecursiveTask无法直接与虚拟线程结合使用。

重新思考递归任务在虚拟线程环境下的实现

RecursiveAction和RecursiveTask的核心价值在于提供了任务分解的抽象,并与ForkJoinPool的窃取式工作队列(work-stealing queue)机制相结合,以有效地平衡平台线程上的工作负载。然而,当引入虚拟线程时,这种工作负载平衡的必要性发生了变化。虚拟线程非常轻量,可以大量创建,并且由JVM运行时高效地映射到少量平台线程上。如果每个子任务都可以在自己的虚拟线程上运行,那么ForkJoinPool提供的复杂工作调度和负载平衡机制可能不再是必需的。开发者可以更直接地实现任务的递归分解,并利用虚拟线程的优势。

方案一:基于CompletableFuture的自定义递归任务

在虚拟线程环境下,我们可以利用CompletableFuture的异步执行能力来构建自定义的递归任务。CompletableFuture.runAsync()或CompletableFuture.supplyAsync()方法可以接受一个Executor,我们可以传入一个创建虚拟线程的Executor,例如Thread::startVirtualThread。

以下是一个简单的示例,演示如何使用CompletableFuture和虚拟线程实现一个递归任务:

import java.util.concurrent.CompletableFuture;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.locks.LockSupport;

public class VirtualThreadRecursiveTask {

    /**
     * 模拟一个递归任务,使用虚拟线程执行子任务。
     * 每个子任务都会在新的虚拟线程中运行。
     */
    record PseudoTask(int from, int to) {
        public static CompletableFuture run(int from, int to) {
            // 使用Thread::startVirtualThread作为Executor,确保任务在虚拟线程中运行
            return CompletableFuture.runAsync(
                new PseudoTask(from, to)::compute, Thread::startVirtualThread);
        }

        protected void compute() {
            int mid = (from + to) >>> 1; // 计算中间值
            if (mid == from) {
                // 达到基本情况,模拟实际处理,可能包含阻塞操作
                System.out.println(Thread.currentThread().getName() + " processing: [" + from + ", " + to + ")");
                LockSupport.parkNanos(TimeUnit.MILLISECONDS.toNanos(50)); // 模拟耗时操作
            } else {
                // 递归分解任务
                CompletableFuture sub1 = run(from, mid);
                CompletableFuture sub2 = run(mid, to);

                // 等待所有子任务完成。这里的join()会阻塞当前虚拟线程,
                // 但由于虚拟线程的特性,它可以在阻塞时被卸载,不会阻塞底层平台线程。
                sub1.join(); 
                sub2.join();
            }
        }
    }

    public static void main(String[] args) throws InterruptedException {
        long startTime = System.currentTimeMillis();
        System.out.println("Starting recursive task with virtual threads...");
        PseudoTask.run(0, 1_000).join(); // 启动根任务并等待其完成
        long endTime = System.currentTimeMillis();
        System.out.println("Recursive task completed in " + (endTime - startTime) + " ms.");
    }
}

注意事项:

  1. join()的阻塞性:尽管CompletableFuture.join()是阻塞的,但在虚拟线程中,这种阻塞不会像在平台线程中那样导致底层操作系统线程的浪费。当虚拟线程被阻塞时,它会被JVM卸载,允许底层平台线程执行其他可运行的虚拟线程。
  2. 线程数量:上述示例中,每个子任务都会创建一个新的虚拟线程,这在任务分解粒度很细时可能导致创建大量的虚拟线程。对于PseudoTask.run(0, 1_000)这样的调用,可能创建接近2000个虚拟线程。虽然虚拟线程非常轻量,但过多的创建和调度仍可能带来开销。

为了优化线程创建数量,可以采用类似ForkJoinPool中“工作窃取”的策略,即一个线程处理一部分任务,另一部分任务提交给其他线程。例如,只将一半范围的任务提交到新的虚拟线程,而另一半则在当前虚拟线程中局部处理:

import java.util.concurrent.CompletableFuture;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.locks.LockSupport;

public class OptimizedVirtualThreadRecursiveTask {

    /**
     * 优化后的递归任务,将一半子任务提交到新的虚拟线程,另一半在当前线程处理。
     */
    record PseudoTask(int from, int to) {
        public static CompletableFuture run(int from, int to) {
            return CompletableFuture.runAsync(
                new PseudoTask(from, to)::compute, Thread::startVirtualThread);
        }

        protected void compute() {
            CompletableFuture pendingFutures = null; // 用于收集异步子任务的CompletableFuture

            // 循环处理,直到达到基本情况
            for (int currentFrom = this.from; ; currentFrom = (currentFrom + to) >>> 1) {
                int mid = (currentFrom + to) >>> 1;
                if (mid == currentFrom) {
                    // 达到基本情况,模拟实际处理
                    System.out.println(Thread.currentThread().getName() + " processing: [" + currentFrom + ", " + to + ")");
                    LockSupport.parkNanos(TimeUnit.MILLISECONDS.toNanos(50));
                    break; // 退出循环
                } else {
                    // 提交一半任务到新的虚拟线程
                    CompletableFuture subTaskFuture = run(currentFrom, mid);
                    if (pendingFutures == null) {
                        pendingFutures = subTaskFuture;
                    } else {
                        // 将新的子任务Future与之前的Future组合
                        pendingFutures = CompletableFuture.allOf(pendingFutures, subTaskFuture);
                    }
                    // 另一半任务 (mid到to) 将在下一次循环中由当前虚拟线程处理
                }
            }

            // 等待所有异步提交的子任务完成
            if (pendingFutures != null) {
                pendingFutures.join();
            }
        }
    }

    public static void main(String[] args) throws InterruptedException {
        long startTime = System.currentTimeMillis();
        System.out.println("Starting optimized recursive task with virtual threads...");
        PseudoTask.run(0, 1_000_000).join(); // 启动根任务并等待其完成,处理更大范围
        long endTime = System.currentTimeMillis();
        System.out.println("Optimized recursive task completed in " + (endTime - startTime) + " ms.");
    }
}

这种优化策略对于PseudoTask.run(0, 1_000_000)这样的大范围任务会产生显著差异,它将创建大约100万个虚拟线程,而不是200万个。这体现了在虚拟线程环境下,开发者仍然需要考虑任务分解的粒度与效率,尽管虚拟线程本身非常轻量。

BibiGPT-哔哔终结者
BibiGPT-哔哔终结者

B站视频总结器-一键总结 音视频内容

下载

方案二:利用StructuredTaskScope进行结构化并发 (孵化中)

Java的孵化模块jdk.incubator.concurrent中引入了StructuredTaskScope,它提供了一种更结构化的方式来管理并发任务的生命周期。StructuredTaskScope允许在一个作用域内启动多个子任务,并等待所有子任务完成,或者在任何子任务失败时关闭整个作用域。这与递归任务的分解和聚合模式非常契合。

import jdk.incubator.concurrent.StructuredTaskScope;
import java.util.concurrent.TimeUnit;
import java.util.concurrent.locks.LockSupport;

public class StructuredTaskScopeRecursiveTask {

    /**
     * 使用StructuredTaskScope实现递归任务。
     * 注意:StructuredTaskScope是孵化API,可能在未来版本中发生变化。
     */
    record PseudoTask(int from, int to) {
        public static void run(int from, int to) {
            // 使用ShutdownOnFailure策略,任何子任务失败都会导致整个作用域关闭
            try (var scope = new StructuredTaskScope.ShutdownOnFailure()) {
                new PseudoTask(from, to).compute(scope);
                scope.join(); // 等待所有子任务完成
                scope.throwIfFailed(); // 抛出任何失败的异常
            } catch (InterruptedException e) {
                Thread.currentThread().interrupt();
                throw new IllegalStateException("Task interrupted", e);
            } catch (Exception e) {
                throw new RuntimeException("Task failed", e);
            }
        }

        protected Void compute(StructuredTaskScope scope) {
            // 同样采用只提交一半任务的优化策略
            for (int currentFrom = this.from; ; currentFrom = (currentFrom + to) >>> 1) {
                int mid = (currentFrom + to) >>> 1;
                if (mid == currentFrom) {
                    // 达到基本情况,模拟实际处理
                    System.out.println(Thread.currentThread().getName() + " processing: [" + currentFrom + ", " + to + ")");
                    LockSupport.parkNanos(TimeUnit.MILLISECONDS.toNanos(50));
                    break;
                } else {
                    var sub = new PseudoTask(currentFrom, mid);
                    // 使用scope.fork()启动子任务,它会在虚拟线程中运行
                    scope.fork(() -> sub.compute(scope));
                }
            }
            return null; // 返回Void
        }
    }

    public static void main(String[] args) {
        long startTime = System.currentTimeMillis();
        System.out.println("Starting recursive task with StructuredTaskScope...");
        PseudoTask.run(0, 1_000_000); // 启动根任务
        long endTime = System.currentTimeMillis();
        System.out.println("StructuredTaskScope recursive task completed in " + (endTime - startTime) + " ms.");
    }
}

StructuredTaskScope的特点:

  • 结构化并发:它强制了子任务的生命周期与父任务的作用域绑定,提高了代码的可读性和可维护性,避免了资源泄漏。
  • 虚拟线程支持:StructuredTaskScope天然支持虚拟线程,其fork()方法默认会在虚拟线程中执行子任务。
  • 集中等待:与CompletableFuture的join()不同,StructuredTaskScope的join()方法通常只在根任务中调用一次,等待所有子任务完成,子任务本身无需等待其直接子任务。
  • 错误处理:ShutdownOnFailure策略能够在一个子任务失败时,优雅地取消其他正在运行的子任务并关闭整个作用域。

注意事项:

  • StructuredTaskScope是一个孵化(Incubator)API,这意味着它可能在未来的Java版本中发生API变更或被移除,不建议在生产环境中使用。

总结与注意事项

尽管RecursiveAction和RecursiveTask无法直接与虚拟线程配合使用,但这并不意味着分治算法无法在Loom中高效实现。相反,虚拟线程提供了更灵活和强大的工具来构建并发的递归任务。

  1. 理解限制:RecursiveAction/RecursiveTask与ForkJoinPool紧密耦合,无法利用虚拟线程。
  2. 拥抱CompletableFuture:对于自定义递归任务,CompletableFuture结合虚拟线程工厂提供了一种直接且强大的实现方式。它允许开发者完全控制任务的分解和执行。
  3. 考虑优化策略:即使在虚拟线程环境下,也应根据任务特性考虑优化策略,例如局部处理一部分任务以减少虚拟线程的创建数量,这对于CPU密集型或大量细粒度任务尤其重要。
  4. 关注StructuredTaskScope:StructuredTaskScope代表了Java并发模型未来的发展方向,它提供了一种更安全、更易于管理的结构化并发范式。尽管目前仍处于孵化阶段,但其设计理念和功能对于处理递归并发任务具有巨大潜力。

在选择实现方案时,开发者应根据项目的具体需求、对API稳定性的要求以及任务的性质(I/O密集型或CPU密集型)进行权衡。对于I/O密集型的递归任务,虚拟线程的优势尤为明显,因为它能显著提高并发度而无需担心线程开销。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
硬盘接口类型介绍
硬盘接口类型介绍

硬盘接口类型有IDE、SATA、SCSI、Fibre Channel、USB、eSATA、mSATA、PCIe等等。详细介绍:1、IDE接口是一种并行接口,主要用于连接硬盘和光驱等设备,它主要有两种类型:ATA和ATAPI,IDE接口已经逐渐被SATA接口;2、SATA接口是一种串行接口,相较于IDE接口,它具有更高的传输速度、更低的功耗和更小的体积;3、SCSI接口等等。

1126

2023.10.19

PHP接口编写教程
PHP接口编写教程

本专题整合了PHP接口编写教程,阅读专题下面的文章了解更多详细内容。

192

2025.10.17

php8.4实现接口限流的教程
php8.4实现接口限流的教程

PHP8.4本身不内置限流功能,需借助Redis(令牌桶)或Swoole(漏桶)实现;文件锁因I/O瓶颈、无跨机共享、秒级精度等缺陷不适用高并发场景。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

1606

2025.12.29

java接口相关教程
java接口相关教程

本专题整合了java接口相关内容,阅读专题下面的文章了解更多详细内容。

20

2026.01.19

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

503

2023.08.10

Java 并发编程高级实践
Java 并发编程高级实践

本专题深入讲解 Java 在高并发开发中的核心技术,涵盖线程模型、Thread 与 Runnable、Lock 与 synchronized、原子类、并发容器、线程池(Executor 框架)、阻塞队列、并发工具类(CountDownLatch、Semaphore)、以及高并发系统设计中的关键策略。通过实战案例帮助学习者全面掌握构建高性能并发应用的工程能力。

87

2025.12.01

页面置换算法
页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章,大家可以免费体验。

407

2023.08.14

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

141

2026.01.28

包子漫画在线官方入口大全
包子漫画在线官方入口大全

本合集汇总了包子漫画2026最新官方在线观看入口,涵盖备用域名、正版无广告链接及多端适配地址,助你畅享12700+高清漫画资源。阅读专题下面的文章了解更多详细内容。

24

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 3万人学习

C# 教程
C# 教程

共94课时 | 7.8万人学习

Java 教程
Java 教程

共578课时 | 52.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号