Golang并发实战：实现一个并发爬虫 Go语言Goroutine与限速控制

P粉602998670

发布时间：2026-03-07 13:01:16

150人浏览过

来源于php中文网

原创

goroutine泄漏导致爬虫oom，主因是http请求后未读取响应体并关闭resp.body，致使连接池阻塞；务必每次调用http.do或http.get后显式调用resp.body.close()。

golang并发实战：实现一个并发爬虫 go语言goroutine与限速控制

goroutine 泄漏导致爬虫内存暴涨

并发爬虫跑着跑着就 OOM，八成不是数据量大，是 goroutine 没收干净。常见于用 http.Get 发请求后，没读完响应体就直接 return，底层连接池会卡住，后续所有依赖该连接的 goroutine 都悬着。

实操建议：

立即学习“go语言免费学习笔记（深入）”；

每次调用 http.Do 或 http.Get 后，必须显式调用 resp.Body.Close()，哪怕你只取状态码
别在 select 里丢掉 case 分支——超时或取消时，要同步停止发请求、关闭管道、回收 goroutine
用 pprof 快速验证：访问 /debug/pprof/goroutine?debug=2，看是不是大量 net/http.(*persistConn).readLoop 卡在 waiting

限速控制不能只靠 time.Sleep

time.Sleep 在高并发下既不准又浪费资源：100 个 goroutine 同时 sleep 100ms，实际可能有 99 个在空等，CPU 毛刺高，还压不住 QPS。

实操建议：

立即学习“go语言免费学习笔记（深入）”；

用 rate.Limiter（来自 golang.org/x/time/rate），它基于 token bucket，支持突发和匀速两种模式
初始化时别写死 rate.Every(100 * time.Millisecond)——这个等价于每秒 10 次，但没考虑突发；更稳妥的是 rate.NewLimiter(rate.Limit(10), 3)，允许最多 3 次突发
在真正发请求前调用 limiter.Wait(ctx)，而不是 sleep 后再发——这样能自然融入上下文取消逻辑

URL 去重和任务分发容易踩 map 并发写 panic

多个 goroutine 同时往一个 map[string]bool 里写已抓取 URL，不出几秒就 fatal error: concurrent map writes。

Runwayml（AI painting）

Runway 平台的文本生成图像AI工具

下载

实操建议：

立即学习“go语言免费学习笔记（深入）”；

别手写带锁 map，直接用 sync.Map 存已访问 URL，读多写少场景下性能不差
更推荐把去重逻辑前置：用 chan string 做任务队列，由单个 goroutine 消费、查重、去重后再派发，避免下游重复判断
如果要用布隆过滤器（比如 github.com/yourbasic/bloom），注意它不支持并发写，得包一层 sync.Mutex

HTTP 客户端复用与超时设置不对，连接池打满

每个请求都 new 一个 http.Client，很快就会报 dial tcp: lookup xxx: no such host 或 too many open files——其实是底层连接没复用，文件描述符耗尽。

实操建议：

立即学习“go语言免费学习笔记（深入）”；

全局复用一个 http.Client 实例，设置 Transport 的 MaxIdleConns 和 MaxIdleConnsPerHost，例如都设为 100
必须设 Timeout、IdleConnTimeout、TLSHandshakeTimeout，否则 DNS 卡住或服务端不响应时，连接永远挂在那里
别信默认值：http.DefaultClient 的 Timeout 是 0（无限等待），生产环境必须覆盖

真正难的不是启动一堆 goroutine，而是让它们在错误、超时、取消、重试之间自然退场。连接没关、令牌没取、管道没关、context 没传到底——这些地方漏一个，爬虫跑一天就变僵尸进程。

如何在Golang中避免返回局部变量的指针错误 Go语言栈内存逃逸分析

Golang中的微服务依赖检查机制 Go语言启动顺序管理与就绪探针

如何在Golang中处理C语言传入的指针 Go语言CGO内存指针转换

Golang开发环境中的时区处理配置 Go语言Timezone环境同步

Go语言中iota的命名渊源：源自希腊字母ι（Iota）的数学与编程传统

相关标签:

go golang go语言爬虫 golang并发 golang select Go语言并发 http

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：Go语言中的defer延迟执行原理 Golang资源释放与闭包陷阱下一篇：暂无

作者最新文章

微信网页版官网地址微信网页版在线登录使用教程

2026-03-05 14:18

iPhone查找App怎么看对方位置_苹果手机实时定位共享教程

2026-03-05 14:19

豆包网页版电脑版入口_豆包网页版浏览器免下载登录入口

2026-03-05 14:19

微信文件传输助手不见了怎么找出来_搜索与找回文件传输助手方法

2026-03-05 14:20

哔哩哔哩bilibili官网首页入口 B站网页版官方直接打开链接

2026-03-05 14:20

拼多多开店需要什么条件拼多多入驻流程与费用标准详解

2026-03-05 14:22

搜有红包官方网站入口搜有红包活动最新网址

2026-03-05 14:22

火狐浏览器怎么解除弹窗拦截_Firefox浏览器弹窗设置

2026-03-05 14:23

小红书搜索记录怎么彻底删除_清理小红书历史搜索词方法

2026-03-05 14:23

Yandex搜索引擎网页版入口_俄罗斯搜索引擎Yandex官网入口

2026-03-05 14:23

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

golang如何定义变量

golang定义变量的方法：1、声明变量并赋予初始值“var age int =值”；2、声明变量但不赋初始值“var age int”；3、使用短变量声明“age :=值”等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

210

2024.02.23

golang有哪些数据转换方法

golang数据转换方法：1、类型转换操作符；2、类型断言；3、字符串和数字之间的转换；4、JSON序列化和反序列化；5、使用标准库进行数据转换；6、使用第三方库进行数据转换；7、自定义数据转换函数。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

246

2024.02.23

golang常用库有哪些

golang常用库有：1、标准库；2、字符串处理库；3、网络库；4、加密库；5、压缩库；6、xml和json解析库；7、日期和时间库；8、数据库操作库；9、文件操作库；10、图像处理库。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

355

2024.02.23

golang和python的区别是什么

golang和python的区别是：1、golang是一种编译型语言，而python是一种解释型语言；2、golang天生支持并发编程，而python对并发与并行的支持相对较弱等等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

214

2024.03.05

golang是免费的吗

golang是免费的。golang是google开发的一种静态强类型、编译型、并发型，并具有垃圾回收功能的开源编程语言，采用bsd开源协议。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

407

2024.05.21

golang结构体相关大全

本专题整合了golang结构体相关大全，想了解更多内容，请阅读专题下面的文章。

450

2025.06.09

golang相关判断方法

本专题整合了golang相关判断方法，想了解更详细的相关内容，请阅读下面的文章。

200

2025.06.10

golang数组使用方法

本专题整合了golang数组用法，想了解更多的相关内容，请阅读专题下面的文章。

1356

2025.06.17

JavaScript浏览器渲染机制与前端性能优化实践

本专题围绕 JavaScript 在浏览器中的执行与渲染机制展开，系统讲解 DOM 构建、CSSOM 解析、重排与重绘原理，以及关键渲染路径优化方法。内容涵盖事件循环机制、异步任务调度、资源加载优化、代码拆分与懒加载等性能优化策略。通过真实前端项目案例，帮助开发者理解浏览器底层工作原理，并掌握提升网页加载速度与交互体验的实用技巧。

2026.03.06

热门下载

网站特效

网站源码

网站素材

前端模板