go test -bench 不是压力测试,它仅测 handler 内存执行开销,需禁用 sleep、加 b.ResetTimer、用 -benchmem 查分配;vegeta 是轻量 HTTP 压测首选,支持 P95/P99 和直方图;手写脚本需控并发、复用 client、禁 keep-alive;压测必采 pprof,关注调度器、锁、GC 瓶颈。

go test -bench 不是压力测试,别拿它压 HTTP 接口
很多人一看到 go test -bench 就以为能压服务,结果测的是内存拷贝速度,不是真实网络请求。它单 goroutine 顺序跑、不建 TCP 连接、不走 DNS、不处理超时重试,BenchmarkHTTPHandler 测的只是 handler 函数在内存里的执行开销。
- 适合场景:纯逻辑函数(如 JSON 解析、加密算法)、mock 掉所有外部依赖后的 handler 单元性能验证
- 必须加
b.ResetTimer(),否则初始化httptest.NewRequest和NewRecorder的耗时全算进去了 - 禁用
time.Sleep—— 它会卡死整个循环,ns/op完全失真 - 加
-benchmem看Allocs/op,如果每次请求分配几百字节,GC 很可能成为瓶颈,而不是 CPU
vegeta 是最省心的入门选择,5 行命令就能跑出可用报告
vegeta 是 Go 写的命令行压测工具,不用写代码、支持 HTTP/2、输出带 P95/P99、错误率、延迟直方图,CI 里直接集成也稳。
- 安装:
go install github.com/tsenart/vegeta@latest - 基础压测(500 QPS,30 秒):
echo "GET http://localhost:8080/api/users" | vegeta attack -rate=500 -duration=30s -timeout=5s | vegeta report - 带 body 和 header(比如登录):
echo "POST http://localhost:8080/api/login" | vegeta attack -body=login.json -header="Content-Type: application/json" -rate=100 -duration=30s -insecure - 关键参数:
-insecure(跳过 HTTPS 证书校验)、-timeout(避免 hang 住)、-ramp(阶梯加压,查拐点)
手写 goroutine 压测脚本,控制并发比“起越多越好”重要得多
自己写脚本不是为了炫技,而是当需要定制化行为(比如按用户 ID 轮询、动态 token 注入、失败重试策略)时,vegeta 不够用。但随便起 10000 个 goroutine,大概率先压垮本地端口或文件描述符。
- 用带缓冲 channel 或
semaphore控制最大并发数,例如:sem := make(chan struct{}, 50) - 复用
*http.Client,设置Transport.MaxIdleConns = 1000和MaxIdleConnsPerHost = 1000,否则连接建立阶段就卡死 - 禁用 keep-alive:
req.Close = true,或客户端显式设Transport.DisableKeepAlives = true,否则掩盖服务端 accept 队列问题 - 记录每个请求的
time.Since(start)和resp.StatusCode,最后用sort.Float64s算 P95/P99,别只看平均值
压测时 pprof 必须同步采,否则等于闭眼开车
压测只看 QPS 和延迟,就像体检只量血压不查血常规。Go 的真实瓶颈往往藏在调度器、锁、GC 里,不采 profile 根本看不到。
立即学习“go语言免费学习笔记(深入)”;
- 服务启动前加:
import _ "net/http/pprof",并监听:6060 - 压测中同步抓三类数据:
wget "http://localhost:6060/debug/pprof/profile?seconds=30"(CPU)、/heap(内存增长)、/goroutine?debug=2(协程堆积) - 重点关注:
runtime.findrunnable占比 >15% → goroutine 泄漏或 channel 阻塞;sync.runtime_SemacquireMutex高频 → 锁争用 - 环境变量提前设好:
GOGC=200 GOMAXPROCS=4,避免默认 GC 频次和单核限制扭曲结果











