goroutine泛滥会导致内存暴涨、调度器过载、gc频繁甚至oom;应通过worker pool等控制层限制并发、管理资源。

Go 的 goroutine 本身不提供任务调度能力,它只是轻量级执行单元;真正决定“高并发任务如何有序、可控、不崩溃地跑起来”的,是你要自己搭的控制层——比如限制并发数、处理错误、传递上下文、回收资源。
goroutine 泛滥会导致什么
直接在循环里无节制起 go func() {...}(),几万次迭代就可能瞬间创建上万个 goroutine。它们不是免费的:内存占用上涨(每个默认栈 2KB)、调度器压力剧增、GC 频繁触发,甚至触发 runtime: goroutine stack exceeds 1000000000-byte limit 或直接 OOM。
- 用
runtime.NumGoroutine()在关键点打日志,观察增长是否失控 - HTTP handler 中尤其危险:一个恶意请求带 1000 个参数,你 foreach 起
goroutine就等于送了个 DoS - 数据库连接、文件句柄、HTTP 客户端连接池等外部资源,几乎必然被超限打挂
用 channel + worker pool 控制并发数
这是最常用也最稳妥的方式:固定数量的长期运行 goroutine 从任务队列取活干,避免瞬时爆发。
func startWorkerPool(jobs <-chan Job, results chan<- Result, workers int) {
for i := 0; i < workers; i++ {
go func() {
for job := range jobs {
results <- job.Process()
}
}()
}
}
<p>// 使用示例
jobs := make(chan Job, 100) // 缓冲区防阻塞生产者
results := make(chan Result, 100)
startWorkerPool(jobs, results, 5) // 严格限定 5 个并发</p><p>// 发任务(非阻塞,超了会丢或需配合 select+default)
for _, j := range allJobs {
select {
case jobs <- j:
default:
log.Println("job dropped: queue full")
}
}
close(jobs)
- 缓冲通道容量要合理:太小导致生产者卡住,太大等于没控流
- worker 数量 ≠ CPU 核心数,得看任务类型:IO 密集可设为 10–100,CPU 密集建议 ≤
runtime.NumCPU() - 别忘了
close(jobs),否则 worker 会永远等下去
用 errgroup.Group 简化错误传播与等待
当所有任务必须成功、任一失败就要中止其余任务时,errgroup.Group 比手写 sync.WaitGroup + 全局 error 变量更安全简洁。
立即学习“go语言免费学习笔记(深入)”;
g, ctx := errgroup.WithContext(context.Background())
g.SetLimit(3) // 同样支持并发限制(v1.21+)
<p>for i := range urls {
url := urls[i] // 注意闭包变量捕获
g.Go(func() error {
req, _ := http.NewRequestWithContext(ctx, "GET", url, nil)
resp, err := http.DefaultClient.Do(req)
if err != nil {
return err
}
defer resp.Body.Close()
return nil
})
}</p><p>if err := g.Wait(); err != nil {
log.Fatal(err) // 任意一个 goroutine 返回非 nil error,这里就立刻返回
}
-
g.SetLimit(n)是 v1.21 加入的,旧版本需手动套 worker pool -
WithContext提供天然取消能力,比如超时后自动中断所有 pending 请求 - 注意循环变量捕获问题:务必用局部变量(如
url := urls[i])再传进闭包
context.WithTimeout 和 recover 不是可选项
没有超时控制的 goroutine 就是定时炸弹;没有 recover 的 panic 会让整个程序退出——这两项在真实服务中必须显式处理。
- HTTP handler 中,用
ctx, cancel := context.WithTimeout(r.Context(), 5*time.Second)包裹所有下游调用 - 对不可信的第三方库调用(比如某些解析器、模板渲染),用
defer func(){ if r := recover(); r != nil { /* 记录并返回 500 */ } }() - 不要依赖
time.Sleep做重试,要用context.AfterFunc或带 cancel 的time.Timer
真正的难点不在“怎么起 goroutine”,而在于“怎么让它按时下班、出错不连累别人、忙不过来时优雅排队”。这些逻辑不会自动发生,得一行行写进去。










