std::chrono::high_resolution_clock是C++11起跨平台纳秒级计时首选,须用同一时钟的两个time_point相减得duration再转换单位;禁用编译器优化、避免绝对时间戳相减、长期监控应改用steady_clock。

用 std::chrono::high_resolution_clock 获取纳秒级时间差
在 C++11 及以后,std::chrono::high_resolution_clock 是最常用、最便携的高精度计时方案。它不依赖系统 API,跨平台(Windows/Linux/macOS)行为一致,且精度通常达纳秒级(实际取决于硬件和 OS 调度,但测量差值足够可靠)。
关键点是:必须用同一个时钟的两个 time_point 相减,得到 duration,再转为所需单位(如毫秒、微秒)。直接用 time(NULL) 或 clock() 精度太低,且受 CPU 占用率影响大。
常见错误:把 high_resolution_clock::now().time_since_epoch().count() 当作绝对时间戳相减——这在某些实现中可能因时钟重置或单调性问题出错;正确做法始终用 operator- 得到 duration。
示例:
立即学习“C++免费学习笔记(深入)”;
#include <chrono> #include <iostream> <p>auto start = std::chrono::high_resolution_clock::now(); // ... 你的代码 auto end = std::chrono::high_resolution_clock::now();</p><p>auto duration = std::chrono::duration_cast<std::chrono::microseconds>(end - start); std::cout << "耗时: " << duration.count() << " 微秒\n";
为什么不用 QueryPerformanceCounter 或 clock_gettime
这些是系统级 API,虽然底层精度高,但破坏了可移植性,且封装不当容易出错。比如 Windows 的 QueryPerformanceCounter 需要配合 QueryPerformanceFrequency 换算,若频率获取失败或未处理整数溢出,结果会偏差几个数量级;Linux 的 clock_gettime(CLOCK_MONOTONIC, ...) 虽稳定,但需手动处理 struct timespec,还涉及链接 -lrt。
除非你在写内核模块、实时系统或对纳秒抖动有极端要求(如高频交易),否则 std::chrono 完全够用,且编译器对其做了充分优化。实测中,high_resolution_clock 在主流编译器(MSVC/GCC/Clang)下生成的汇编与直接调用系统 API 几乎等价。
注意:high_resolution_clock 在部分旧版 MinGW 或嵌入式 STL 中可能退化为 system_clock,可通过静态断言验证:
static_assert(std::chrono::high_resolution_clock::is_steady,
"high_resolution_clock must be steady");
测试时避免编译器优化干扰计时结果
如果你测的是一个简单函数(比如排序小数组),编译器可能在 -O2 下整个优化掉,导致测出 0ns。这不是计时器不准,而是代码没执行。
解决方法:
- 用
volatile或std::atomic强制保留计算结果(例如把返回值存到volatile int sink) - 将待测逻辑封装进函数,并禁用内联:
[[gnu::noinline]](GCC/Clang)或__declspec(noinline)(MSVC) - 运行多次取最小值或中位数,排除 OS 调度抖动(单次测量意义不大)
示例防优化写法:
[[gnu::noinline]] int compute_heavy() {
int sum = 0;
for (int i = 0; i < 1000000; ++i) sum += i * i;
return sum;
}
<p>volatile int sink = compute_heavy(); // 防止被优化掉
跨平台计时库要不要引入?
像 Boost.Chrono 或 folly::Chrono 提供了更丰富的格式化和统计工具,但对单纯“测一段代码跑多久”属于过度设计。C++ 标准库的 chrono 已覆盖全部基础需求:构造、相减、转换、输出。
真正容易被忽略的是时钟的“稳定性”和“单调性”。high_resolution_clock 标准只要求它是“最高分辨率的可用时钟”,但未强制要求单调(即不保证不会倒流)。实践中,所有主流实现都基于单调时钟(如 Linux 的 CLOCK_MONOTONIC、Windows 的 QueryPerformanceCounter),但如果你做长时间运行的性能监控(小时级),建议显式使用 steady_clock ——它标准规定必须单调且不可逆。
所以,日常测试用 high_resolution_clock 没问题;长期服务监控请改用 std::chrono::steady_clock。










