0

0

SQL 如何实现“增量同步”避免全量同步的方案

舞夢輝影

舞夢輝影

发布时间:2026-01-28 21:16:37

|

124人浏览过

|

来源于php中文网

原创

用WHERE+时间戳字段做增量判断最常用,需建有效索引、用>而非>=防重复、统一时区、逻辑删除或CDC捕获删除、主表时间字段过滤、游标分页替代OFFSET、复合索引支持排序、预留缓冲窗口防时钟漂移。

sql 如何实现“增量同步”避免全量同步的方案

WHERE + 时间戳字段做增量判断最常用

绝大多数业务表都有 updated_atcreate_time 字段,这是实现增量同步最直接的依据。关键不是“有没有”,而是“索引是否有效”和“边界是否严谨”。

  • 必须给时间字段建索引,否则每次查都全表扫描,增量变慢量
  • 同步时要用 WHERE updated_at > '2024-06-01 00:00:00',不能用 >=,否则重复拉取上一批最后一条(尤其高并发更新场景)
  • 注意数据库时区:MySQL 默认用系统时区,PostgreSQL 可能默认 timestamp without time zone,跨服务同步前先对齐时钟或统一转为 UTC 存储

处理删除操作必须靠逻辑删除或变更日志

纯靠 updated_at 拉不到已删数据,所以物理删除无法被下游感知。常见解法只有两个,没有中间路线:

  • 强制业务改用逻辑删除:加 is_deleted 字段 + deleted_at,同步 SQL 改为 WHERE updated_at > ? OR deleted_at > ?
  • 启用数据库原生 CDC:MySQL 开 binlog(格式必须为 ROW),PostgreSQL 开 logical replication,SQL Server 开 Change Data Capture——这些能捕获 INSERT/UPDATE/DELETE 全事件
  • 避免用触发器模拟日志:维护成本高、易丢事件、影响主库性能

JOIN 多表同步时,增量字段必须来自主表且可索引

比如同步订单+订单项,想按订单更新时间增量拉,就不能写 SELECT * FROM orders o JOIN order_items i ON o.id = i.order_id WHERE i.updated_at > ?——这会漏掉“订单更新但子项没动”的情况,且 i.updated_at 索引对主表无加速作用。

  • 正确做法是只用主表(orders)的 updated_at 过滤,再关联子表;如需子表变更也触发同步,得单独建子表的增量任务
  • 如果必须单次拉取完整订单(含最新子项),且子项有独立更新逻辑,建议在订单表加 latest_item_updated_at 冗余字段,由应用层或触发器维护
  • 不要依赖 MAX(i.updated_at) 聚合后过滤:GROUP BY 会让索引失效,大数据量下变成慢查询

避免 OFFSET 分页导致的漏数据或重复

LIMIT 1000 OFFSET 10000 做分批同步,在并发写入场景下极易漏行或重复——因为 OFFSET 是基于当前快照计数,而新数据插入会挤占位置。

  • 一律改用游标分页:WHERE updated_at > '2024-06-01 10:00:00' ORDER BY updated_at, id LIMIT 1000,每次用上一批最后一条的 (updated_at, id) 当下一批起点
  • 复合游标字段必须有联合索引,例如 INDEX idx_updated_id (updated_at, id),否则排序仍走 filesort
  • 如果表没主键或主键不连续(比如 UUID),优先用自增 id 或数据库序列值做第二排序字段,别依赖 updated_at 单独排序(同一秒可能多条)

实际中最容易被忽略的是时钟漂移和事务可见性:上游事务提交时间和 binlog 写入时间有微小延迟,下游如果严格按时间戳拉,可能某条刚提交的记录被跳过。这时候得预留几秒缓冲窗口,或者用位点(binlog position / LSN)代替时间戳做精确锚点。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

727

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

327

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

350

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1243

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

360

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

821

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

581

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

423

2024.04.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

158

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.9万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 812人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号