C++中最主流、集成度最高的模糊测试方案是libFuzzer,它以静态库形式链接代码,需编写LLVMFuzzerTestOneInput函数,配合Clang与Sanitizer进行覆盖率引导 fuzzing。

在C++中做模糊测试,最主流、集成度最高、适合开发者日常使用的方案是 libFuzzer —— 它不是独立运行的黑盒工具,而是以静态库形式链接进你的代码,通过编写一个轻量级的 fuzz target 函数,就能让编译器(Clang)自动注入覆盖率引导的随机输入,持续发现崩溃、断言失败、内存越界等缺陷。
libFuzzer 的核心使用流程
它依赖 Clang 编译器和 Sanitizer(尤其是 AddressSanitizer 和 UndefinedBehaviorSanitizer),整个过程是白盒+覆盖率驱动的:
- 写一个函数
LLVMFuzzerTestOneInput(const uint8_t *data, size_t size),把待测逻辑“塞进去” - 用
clang++ -fsanitize=fuzzer,address,undefined编译(注意:必须用 Clang,GCC 不支持) - 直接运行生成的可执行文件,libFuzzer 自动启动 fuzz loop,生成输入、执行、监控崩溃、保存用例
- 崩溃时会自动生成
crash-xxx文件,可用gdb ./fuzz_target crash-xxx直接复现定位
一个最小可运行的 fuzz target 示例
比如你要测试一个解析 JSON 字符串的函数 parse_json(const char* s):
#include <cstdint>
#include <cstddef>
<p>extern "C" int LLVMFuzzerTestOneInput(const uint8_t <em>data, size_t size) {
// 确保 data 是以 \0 结尾的字符串(避免越界读)
if (size == 0) return 0;
// 构造临时缓冲区,保证结尾有 \0
char </em>buf = new char[size + 1];
memcpy(buf, data, size);
buf[size] = '\0';</p><p>parse_json(buf); // 调用你的真实函数</p><p><span>立即学习</span>“<a href="https://pan.quark.cn/s/6e7abc4abb9f" style="text-decoration: underline !important; color: blue; font-weight: bolder;" rel="nofollow" target="_blank">C++免费学习笔记(深入)</a>”;</p><div class="aritcle_card flexRow">
<div class="artcardd flexRow">
<a class="aritcle_card_img" href="/ai/1270" title="Magic AI Avatars"><img
src="https://img.php.cn/upload/ai_manual/001/431/639/68b6db28b2e74845.png" alt="Magic AI Avatars" onerror="this.onerror='';this.src='/static/lhimages/moren/morentu.png'" ></a>
<div class="aritcle_card_info flexColumn">
<a href="/ai/1270" title="Magic AI Avatars">Magic AI Avatars</a>
<p>神奇的AI头像,获得200多个由AI制作的自定义头像。</p>
</div>
<a href="/ai/1270" title="Magic AI Avatars" class="aritcle_card_btn flexRow flexcenter"><b></b><span>下载</span> </a>
</div>
</div><p>delete[] buf;
return 0;
}⚠️ 注意:所有外部依赖(如 parse_json)必须被编译进同一个二进制;若函数在单独的 .cpp 文件里,记得一起编译进去。
提升 fuzz 效果的关键技巧
libFuzzer 不是“扔进去就完事”,合理设计能显著提升发现深度漏洞的能力:
- 避免非确定性行为:关闭随机数、时间戳、多线程、文件/网络 I/O——fuzz target 必须纯函数式、可重入、每次输入相同就输出相同
-
用
__AFL_LOOP或-runs=控制迭代次数:适合 CI 中做轻量回归,例如./fuzz_target -runs=100000 -
提供语料库(corpus):把已知合法/非法样例放进目录,用
./fuzz_target seed_corpus/启动,libFuzzer 会基于它们变异出新输入 -
加字典(dictionary):对协议类代码(如 JSON、HTTP),用
-dict=json.dict告诉 fuzzer 常见关键字("{","name",":"),大幅提升结构化输入生成效率
常见问题与绕过方法
实际用起来容易卡在几个典型问题上:
- “undefined reference to `LLVMFuzzerTestOneInput`”:没定义该函数,或拼写错误(必须是 extern "C",大小写严格)
-
“Failed to allocate” 或快速退出:检查是否在 fuzz target 内部做了大量堆分配但没释放,触发 sanitizer 的内存限制;可加
-max_len=4096限制输入长度 -
找不到崩溃?试试
-detect_leaks=1(检测内存泄漏)、-timeout=20(超时检测挂起) - 想测 C++ 类成员函数?:把它包装成静态函数或 lambda(捕获 this 需谨慎),确保无状态残留
基本上就这些。libFuzzer 上手门槛低,但威力很强——尤其适合单元级别、库级别、parser / serializer / codec 这类数据驱动模块的自动化健壮性验证。不需要额外部署服务,不依赖 Python 脚本,一次编译,反复运行,崩溃即证据。









