并行流基于Fork/Join框架,通过parallelStream()或parallel()实现多线程数据处理,适用于大数据集的filter、map、reduce等操作,但需注意数据量、顺序依赖、共享状态和装箱成本,性能提升需权衡线程开销。

Java中的Parallel Stream(并行流)是Stream API的一部分,它能自动将数据流拆分成多个部分,并在多个线程上并行处理,从而提升处理大量数据时的性能。并行流基于Fork/Join框架实现,使用起来非常简单,只需将普通流转换为并行流即可。
创建并行流
有多种方式可以获取一个并行流:
- 调用集合的 parallelStream() 方法直接获取并行流
- 对已有流调用 parallel() 方法将其转为并行模式
List
// 方式一:使用 parallelStream()
numbers.parallelStream().forEach(n -> System.out.println(n + " 线程: " + Thread.currentThread().getName()));
// 方式二:先获取stream再转为parallel
numbers.stream().parallel().forEach(n -> System.out.println(n));
常见操作示例
并行流支持所有常见的中间和终端操作,如 filter、map、reduce、collect 等,执行过程会自动并行化。
filter + map + collect 并行处理:
List
.filter(n -> n % 2 == 0)
.map(n -> "偶数: " + n)
.collect(Collectors.toList());
int sum = numbers.parallelStream()
.reduce(0, Integer::sum);
注意事项与适用场景
虽然并行流使用方便,但并非在所有情况下都能提升性能,需注意以下几点:
家电公司网站源码是一个以米拓为核心进行开发的家电商城网站模板,程序采用metinfo5.3.9 UTF8进行编码,软件包含完整栏目与数据。安装方法:解压上传到空间,访问域名进行安装,安装好后,到后台-安全与效率-数据备份还原,恢复好数据后到设置-基本信息和外观-电脑把网站名称什么的改为自己的即可。默认后台账号:admin 密码:132456注意:如本地测试中127.0.0.1无法正常使用,请换成l
立即学习“Java免费学习笔记(深入)”;
- 数据量要足够大:小数据集使用并行流可能因为线程开销反而更慢
- 避免依赖顺序的操作:并行流不保证处理顺序,forEachOrdered 可保持顺序但牺牲并行性
- 无状态操作更安全:确保 map、filter 等操作不修改共享变量,避免竞态条件
- 装箱成本:基本类型频繁装箱会影响性能,可考虑使用 IntStream、LongStream 的 parallel 版本
自定义并行流的线程池(进阶)
默认并行流使用 ForkJoinPool.commonPool(),可通过反射或运行时参数调整其大小。若需更精细控制,可手动提交任务到自定义的 ForkJoinPool。
示例:使用自定义线程池(间接方式):
ForkJoinPool customPool = new ForkJoinPool(4);
customPool.submit(() ->
numbers.parallelStream().forEach(n -> {
System.out.println(n + " 执行线程: " + Thread.currentThread().getName());
})
).get();
customPool.shutdown();
基本上就这些。合理使用Parallel Stream可以在处理大批量数据时显著提升效率,关键是理解它的执行机制和适用边界。不复杂但容易忽略细节。









