robfig/cron/v3 更适合 web 服务,因其稳定、支持时区、可与 http.server 生命周期对齐,而 gocron 轻量但缺乏时区和状态管理,易漏执行。

Go cron 库选哪个:robfig/cron 还是 jasonlvhit/gocron?
robfig/cron(v3)仍是 Web 服务中最稳的选择,尤其适合与 http.Server 生命周期对齐;jasonlvhit/gocron 更轻但不支持时区和 Job 状态管理,容易在重启后漏执行。
关键区别在于调度模型:robfig/cron 是单 goroutine 轮询 + 延迟队列,资源可控;gocron 默认每秒全量扫描所有任务,QPS 高时 CPU 毛刺明显。
- Web 服务中必须用
cron.WithChain(cron.Recover()),否则 panic 会 kill 整个调度器 -
robfig/cron/v3的SecondsField默认关闭,要支持秒级需显式启用:cron.New(cron.WithSeconds()) - 别直接在
func() {}里写 DB 查询——HTTP handler 和 cron job 共享*sql.DB没问题,但没加 context 超时会导致连接堆积
如何让 cron 任务随 HTTP Server 启停?
不能把 c.Start() 放在 main() 末尾就完事。Web server 启动后 cron 才能开始,server 关闭前 cron 必须先 Stop(),否则 SIGTERM 杀进程时 goroutine 被强杀,正在跑的任务中断无日志。
典型错误是用 defer c.Stop() —— 它只在函数退出时触发,而 http.ListenAndServe 是阻塞调用,defer 根本不会执行。
立即学习“go语言免费学习笔记(深入)”;
专为中小型企业定制的网络办公软件,富有竞争力的十大特性: 1、独创 web服务器、数据库和应用程序全部自动傻瓜安装,建立企业信息中枢 只需3分钟。 2、客户机无需安装专用软件,使用浏览器即可实现全球办公。 3、集成Internet邮件管理组件,提供web方式的远程邮件服务。 4、集成语音会议组件,节省长途话费开支。 5、集成手机短信组件,重要信息可直接发送到员工手机。 6、集成网络硬
- 用
sync.WaitGroup+context.WithCancel协调生命周期:ctx, cancel := context.WithCancel(context.Background()) - 启动时:
go func() { c.Run() }(),关闭时先c.Stop()再cancel() - 如果用了 Gin/Echo,把
c存进gin.Engine的Options或自定义中间件字段里,方便统一管理
定时任务里调用 HTTP 接口失败,为什么日志里看不到错误?
因为 robfig/cron 默认吞掉所有 panic 和未捕获 error,除非你显式加了 cron.Recover() 链,并且 logger 配置了输出目标(默认是 os.Stderr,但很多容器环境会丢掉)。
更隐蔽的问题是:cron job 里用 http.DefaultClient 发请求,没设 Timeout,一旦下游卡住,这个 job 就永远占着调度器 goroutine,后续同 schedule 的任务全部积压。
- 务必给每个 HTTP client 加超时:
&http.Client{Timeout: 5 * time.Second} - 错误日志必须带时间戳和 job 名:
log.Printf("[job:sync_user] http err: %v", err) - 别依赖
fmt.Println—— cron 下它可能输出到 nowhere,尤其在 systemd 或 k8s 中
多个实例部署时,同一个定时任务重复执行怎么办?
这是分布式场景下最常踩的坑:每个实例都起了自己的 cron,0 2 * * * 的备份任务在三台机器上同时跑三次,DB 被写爆、API 被限流。
robfig/cron 本身不提供分布式锁,得自己加。别用文件锁或本地内存标记——跨实例无效;也别手撸 Redis SETNX,容易死锁或过期不一致。
- 推荐用
github.com/go-redsync/redsync/v4,配合 Redis 实现可重入、带自动续期的分布式锁 - 锁 key 要带服务标识:
lock := rs.NewMutex("cron:backup_users:" + os.Getenv("HOSTNAME")) - 锁超时必须大于任务最长执行时间,且任务内要定期
Extend(),否则中途锁过期会导致并发
真正难的不是加锁,而是锁失败时的降级策略——比如跳过本次、记录告警、还是退化为 leader 选举。这些逻辑一旦漏掉,线上就是静默故障。









