0

0

C++如何利用std::execution进行算法的大规模并行化加速?(C++17并行STL)

冰火之心

冰火之心

发布时间:2026-03-10 11:58:03

|

705人浏览过

|

来源于php中文网

原创

不能,多数情况下反而更慢甚至崩溃;并行策略需匹配数据规模、硬件能力及算法线程安全性,小数组或简单类型通常不受益。

c++如何利用std::execution进行算法的大规模并行化加速?(c++17并行stl)

std::execution::par_unseq 能不能直接套在 sort 上就变快?

不能,多数情况下反而更慢,甚至崩溃。并行策略不是开关,它依赖数据规模、硬件并发能力、算法内部是否线程安全。

常见错误现象:std::sort(std::execution::par_unseq, v.begin(), v.end()) 在小数组(比如 c++ 11 之前)根本不支持 par_unseqsort 的完整语义。

  • 使用场景:仅当 v.size() > 10^5 且元素比较/移动开销显著(如自定义类型含字符串或指针操作)时才值得尝试
  • 参数差异:par 允许任务拆分但不允许多个线程同时访问同一内存位置;par_unseq 允许向量化+乱序执行,但要求用户确保无数据竞争——比如不能在 transform 的 lambda 里修改全局变量
  • 性能影响:现代 CPU 上,par_unseqtransformreduce 效果明显;对 sort 效果高度依赖实现,MSVC 的并行 sort 比 GCC 更成熟

哪些 STL 算法真正支持并行且稳定?

支持 ≠ 安全。真正经过主流实现(libstdc++、libc++、MSVC STL)充分测试的只有几个: transformfor_eachreduceexclusive_scaninclusive_scan。像 find_ifnth_element 虽然语法合法,但行为未被广泛验证。

容易踩的坑:for_each(std::execution::par, v.begin(), v.end(), [](auto& x) { x *= 2; }) 看似安全,但如果 vstd::vector<:string></:string>,且字符串内部用写时复制(COW),多线程修改可能引发未定义行为——COW 在 C++11 后已被弃用,但某些旧 ABI 仍存在残留。

立即学习C++免费学习笔记(深入)”;

Beautiful.ai
Beautiful.ai

AI在线创建幻灯片

下载
  • 必须检查迭代器是否为随机访问(vector/deque 可以,list 不行)
  • lambda 不能捕获局部栈变量地址(除非是 const 值捕获),否则线程间共享栈帧会出问题
  • reduce 要求二元操作满足结合律,且初始值必须与元素类型可转换;用 + 没问题,用 - 就错

为什么开了并行反而结果不对?

根本原因:你写的代码本身不是线程安全的,而 std::execution 不帮你加锁。它只负责把工作分发出去,不保证访问隔离。

典型错误现象:int sum = 0; for_each(par, v.begin(), v.end(), [&](int x) { sum += x; }); —— 这段代码在所有编译器上都产生随机结果,因为 sum 是共享可变状态,没有任何同步机制。

  • 正确做法:用 reduce 替代,或把中间结果存在局部 vector 再合并
  • 别依赖副作用:任何修改外部变量、调用非 const 成员函数、写文件、打日志的操作,在并行策略下都是雷区
  • 调试技巧:先用 std::execution::seq 跑通逻辑,再换 par;用 AddressSanitizer + ThreadSanitizer 编译,能立刻暴露竞态

Windows / Linux 下实际加速效果差很多,怎么回事?

不是编译器问题,是线程池和调度策略差异。Linux 默认用 pthread + 内核线程,调度粒度细;Windows 的 ConCRT(MSVC 使用)或 TBB(GCC/Clang 常配)在线程创建和负载均衡上更保守。

实测常见情况:同样 100 万整数 transform,在 8 核 Linux(GCC 12 + libstdc++)上加速比约 5.2x;在 Windows(MSVC 19.3x)上仅 3.1x,且首次运行延迟明显更高——因为默认线程池要预热。

  • 解决办法:MSVC 用户可手动初始化线程池,调用 concurrency::set_max_concurrency(8);GCC/Clang 用户建议链接 -ltbb 并设置环境变量 TBB_NUM_THREADS=8
  • 兼容性注意:std::execution::par 在 C++17 中是 optional feature,某些嵌入式 STL(如 libc++ for bare metal)完全不提供
  • 别信 -O3 自动并行化:那是编译器向量化(SIMD),和 std::execution 完全是两层机制,不能混用

最常被忽略的一点:并行算法的启动开销固定在几百微秒级,处理少于 10k 元素时,这开销就吃掉了全部收益。别为了“用了新特性”而并行,先跑个 perf 或 VTune 看瓶颈到底在哪。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
sort排序函数用法
sort排序函数用法

sort排序函数的用法:1、对列表进行排序,默认情况下,sort函数按升序排序,因此最终输出的结果是按从小到大的顺序排列的;2、对元组进行排序,默认情况下,sort函数按元素的大小进行排序,因此最终输出的结果是按从小到大的顺序排列的;3、对字典进行排序,由于字典是无序的,因此排序后的结果仍然是原来的字典,使用一个lambda表达式作为key参数的值,用于指定排序的依据。

409

2023.09.04

c语言const用法
c语言const用法

const是关键字,可以用于声明常量、函数参数中的const修饰符、const修饰函数返回值、const修饰指针。详细介绍:1、声明常量,const关键字可用于声明常量,常量的值在程序运行期间不可修改,常量可以是基本数据类型,如整数、浮点数、字符等,也可是自定义的数据类型;2、函数参数中的const修饰符,const关键字可用于函数的参数中,表示该参数在函数内部不可修改等等。

561

2023.09.20

全局变量怎么定义
全局变量怎么定义

本专题整合了全局变量相关内容,阅读专题下面的文章了解更多详细内容。

91

2025.09.18

python 全局变量
python 全局变量

本专题整合了python中全局变量定义相关教程,阅读专题下面的文章了解更多详细内容。

106

2025.09.18

js 字符串转数组
js 字符串转数组

js字符串转数组的方法:1、使用“split()”方法;2、使用“Array.from()”方法;3、使用for循环遍历;4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容,供大家免费下载体验。

739

2023.08.03

js截取字符串的方法
js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容,供大家免费下载体验。

220

2023.09.04

java基础知识汇总
java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友,请阅读本专题下面的的有关文章,欢迎大家来php中文网学习。

1564

2023.10.24

字符串介绍
字符串介绍

字符串是一种数据类型,它可以是任何文本,包括字母、数字、符号等。字符串可以由不同的字符组成,例如空格、标点符号、数字等。在编程中,字符串通常用引号括起来,如单引号、双引号或反引号。想了解更多字符串的相关内容,可以阅读本专题下面的文章。

649

2023.11.24

Kotlin Android模块化架构与组件化开发实践
Kotlin Android模块化架构与组件化开发实践

本专题围绕 Kotlin 在 Android 应用开发中的架构实践展开,重点讲解模块化设计与组件化开发的实现思路。内容包括项目模块拆分策略、公共组件封装、依赖管理优化、路由通信机制以及大型项目的工程化管理方法。通过真实项目案例分析,帮助开发者构建结构清晰、易扩展且维护成本低的 Android 应用架构体系,提升团队协作效率与项目迭代速度。

24

2026.03.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
C# 教程
C# 教程

共94课时 | 11万人学习

C 教程
C 教程

共75课时 | 5.3万人学习

C++教程
C++教程

共115课时 | 21.2万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号