C++怎么做基准测试 C++代码性能benchmark测试【指南】

尼克

发布时间：2026-03-08 15:03:32

539人浏览过

来源于php中文网

原创

用 std::chrono 手写基准测试最稳妥，需循环多次取中位数或最小值、禁用优化、预分配内存、固定 cpu 频率与核心，并验证内联与汇编。

c++怎么做基准测试 c++代码性能benchmark测试【指南】

用 `std::chrono` 手写基准测试最稳妥

自己控制测量逻辑，避免框架引入的调度、缓存、预热偏差。C++ 标准库的 std::chrono 足够精确（纳秒级），且无额外依赖。

常见错误是只测单次运行时间——受 CPU 频率波动、TLB miss、分支预测失败等干扰极大，结果不可信。

必须循环多次（比如 1000–10000 次），取中位数或多次测量的最小值（更贴近“理想路径”耗时）
每次循环前加 _mm_pause() 或 std::this_thread::yield() 降低调度干扰（非必需但推荐）
用 std::chrono::high_resolution_clock::now()，别用 system_clock（它可能被系统时间调整拖累）
确保被测函数不被编译器优化掉：对返回值做 volatile 强制读取，或用 do_not_optimize_away() 类似手法

`google/benchmark` 适合中大型项目但得小心配置

它自动处理预热、迭代次数、统计（如均值、标准差）、输出格式，但默认行为容易误导人。

典型问题：没关 CPU 频率缩放（scaling_governor=performance），或没绑核（taskset -c 0 ./bench），导致数据抖动超 20%。

立即学习“C++免费学习笔记（深入）”；

SekoTalk

商汤科技推出的AI对口型视频创作工具

下载

务必启用 BENCHMARK_MAIN() 并用 BENCHMARK(BM_Func)->Repetitions(3)->ReportAggregatesOnly(true) 控制重复与聚合方式
禁用编译器对 benchmark 函数的 LTO 和 whole-program 优化（加 -fno-lto -fno-semantic-interposition）
Linux 下运行前执行：echo performance | sudo tee /sys/devices/system/cpu/cpu*/cpufreq/scaling_governor
注意 State::PauseTiming() 和 State::ResumeTiming() —— 初始化开销必须剔除，否则测的是“构造+计算”而非纯计算

别信 Release 模式下没内联的函数耗时

很多“慢函数”在实际调用链里根本不会单独存在——它们会被 inline 进上层，消除调用开销和寄存器保存成本。手写 benchmark 如果强制不内联（[[gnu::noinline]]），测出来的是下界失真值。

真实性能看的是上下文：是否在 hot loop 里？参数是否常量？是否触发 vectorization？

想验证内联效果，对比加 [[gnu::always_inline]] 和不加的 benchmark 结果
用 objdump -d 或 Compiler Explorer 看汇编，确认关键路径是否真的 inlined
对模板函数，benchmark 必须用具体实例化类型（如 BM_VectorAdd<int></int>），否则编译器可能生成泛型未优化版本

内存分配是最大隐藏变量

哪怕只测一个 std::vector::push_back，如果没预分配（reserve），就混入了 malloc、页表更新、TLB 填充等非目标开销。

更隐蔽的是：不同 benchmark 轮次之间，堆内存碎片程度不同，new 耗时可能差 3 倍。

所有涉及堆分配的测试，必须在 State::StartKeepRunning() 外预分配好缓冲区，循环内只操作已分配内存
用 std::pmr::monotonic_buffer_resource 替代默认分配器，能大幅压平方差
怀疑是缓存效应？加 __builtin_ia32_clflushopt 刷特定内存地址，或用 posix_memalign 分配独占 cache line 的 buffer

真正难的不是跑出一个数字，而是让两次 benchmark 的硬件状态、内存布局、指令流水线深度尽可能一致。哪怕同一台机器，隔五分钟再跑，结果都可能漂移——这不是工具的问题，是现代 CPU 本身就不打算给你确定性。

如何在C++中利用std::optional处理函数返回值？（优雅代码）

C++怎么用友元 C++友元函数和友元类用法【进阶】

为什么现代C++推荐使用nullptr而不是NULL？（强类型安全）

C++ short int常量怎么写 C++ short变量赋初值【入门】

c++中如何定义友元函数_c++ friend关键字访问私有成员【精讲】

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

c++ echo 常量 volatile 循环堆泛型 linux gnu

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：C++如何构建支持断点续传的文件下载模块？（网络协议实现）下一篇：暂无

作者最新文章

Sublime如何启用拖动文件到编辑器自动打开？（便捷操作）

2026-03-06 14:59

今日头条怎么清除缓存数据今日头条释放存储空间【缓存】

2026-03-06 15:00

Sublime如何配置Lua开发环境_Sublime运行Lua脚本教程【全攻略】

2026-03-06 15:00

php怎么判断字符串为空 php检查字符串是否为空【常识】

2026-03-06 15:01

win11怎么开启文件夹缩略图 win11不显示图片预览解决【技巧】

2026-03-06 15:10

悟空浏览器怎么收藏网页悟空浏览器怎么查看我的书签【收藏】

2026-03-06 15:13

win10怎么重置系统设置 win10恢复出厂设置详细流程【救急】

2026-03-06 15:15

夸克浏览器官网网页版入口夸克浏览器在线网页入口

2026-03-06 15:22

Sublime怎么切换行尾符_Sublime换行符设置教程【兼容】

2026-03-06 15:25

夸克浏览器怎么修改UA标识夸克浏览器怎么模拟电脑网页【内核】

2026-03-06 15:28

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1561

2023.10.24

c++中volatile关键字的作用

本专题整合了c++中volatile关键字的相关内容，阅读专题下面的文章了解更多详细内容。

2025.10.23

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

435

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

601

2023.08.10

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1542

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

716

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

300

2023.06.30

linux修改文件名

本专题为大家提供linux修改文件名相关的文章，这些文章可以帮助用户快速轻松地完成文件名的修改工作，大家可以免费体验。

799

2023.07.05

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板