0

0

SQL INSERT…SELECT 高效写入实践

舞姬之光

舞姬之光

发布时间:2026-02-15 13:47:02

|

570人浏览过

|

来源于php中文网

原创

insert…select 比循环 insert 快,因其单语句批量搬运,避免网络往返、连接开销与逐行解析;mysql/postgresql 内部缓冲整结果集,事务日志与索引更新更紧凑。

sql insert…select 高效写入实践

INSERT…SELECT 为什么比循环 INSERT 快得多

因为它是单条语句完成批量数据搬运,避免了网络往返、连接开销和逐行解析。MySQL 或 PostgreSQL 在执行时会把整个 SELECT 结果集作为内部缓冲,一次性写入目标表,事务日志、索引更新也更紧凑。

常见错误现象:Lock wait timeout exceededOut of memory —— 多半是 SELECT 返回几百万行却没加 LIMIT 或没分批,导致锁住源表太久或撑爆 buffer。

使用场景:ETL 中间层落地、归档旧数据、物化视图初始化、跨库同步(配合 FEDERATEDpostgres_fdw)。

  • 确保目标表主键/唯一约束与 SELECT 字段顺序、类型严格匹配,否则可能静默截断或报 Duplicate entry
  • 如果源表有大字段(TEXTBLOB),而目标表对应列为 VARCHAR(255),MySQL 默认会截断且不报错(除非开了 STRICT_TRANS_TABLES
  • PostgreSQL 中若 SELECT 含 serial 列,目标表对应列必须是 GENERATED ALWAYS AS IDENTITY 或显式插入值,否则报 cannot insert into column "id"

怎么控制 INSERT…SELECT 的事务粒度和内存占用

默认是一次性提交所有行,对大表风险极高。不能靠应用层“手动分页”(比如 SELECT ... LIMIT 10000 OFFSET 0),因为 OFFSET 深度越大越慢,且并发写入时容易漏/重。

推荐用游标 + 主键范围分片:

INSERT INTO orders_archive
SELECT * FROM orders 
WHERE order_id BETWEEN 100000 AND 199999;

关键点:

  • 分片字段必须是**有索引的单调递增列**(如 idcreated_at),避免全表扫描
  • 每次处理行数建议 1w–10w,具体看单行大小;超过 50MB 的结果集就该拆
  • MySQL 中可通过 SET SESSION sort_buffer_size = 4*1024*1024 临时调大排序缓存,但别改全局值
  • PostgreSQL 中注意 work_mem,太小会导致大量磁盘临时文件,拖慢速度

INSERT…SELECT 遇到 ON DUPLICATE KEY UPDATE 怎么办

MySQL 支持,但语法只允许在 INSERT 侧写逻辑,不能在 SELECT 里做条件判断。典型误用:INSERT INTO t1 SELECT ..., IF(..., 'a', 'b') FROM t2 ON DUPLICATE KEY UPDATE col=VALUES(col) —— 这里 VALUES(col) 只能取当前这一行 SELECT 的值,不能引用其他列或函数结果。

上班人导航
上班人导航

上班人必备的职场办公导航网站

下载

真正能用的组合只有两种:

  • ON DUPLICATE KEY UPDATE col = VALUES(col):安全,直接覆盖
  • ON DUPLICATE KEY UPDATE col = COALESCE(VALUES(col), col):保留原值优先,仅当新值非 NULL 才更新

想实现“存在则累加、不存在则插入”,必须确保 SELECT 中已算好最终值,例如:

INSERT INTO stats (day, clicks) 
SELECT '2024-06-01', SUM(clicks) FROM raw_logs WHERE date = '2024-06-01'
ON DUPLICATE KEY UPDATE clicks = clicks + VALUES(clicks);

注意:VALUES(clicks) 是 SELECT 计算出的那个 sum 值,不是原始表里的某一行。

PostgreSQL 中 INSERT…SELECT 没有 ON CONFLICT 怎么办

它有,只是叫法不同:ON CONFLICT DO UPDATE。但陷阱在于:必须显式指定冲突目标(通常是主键或唯一索引),不能只写 ON CONFLICT

常见错误现象:there is no unique or exclusion constraint matching the ON CONFLICT specification —— 表上确实没建唯一索引,或者建了但字段顺序/表达式不一致。

实操要点:

  • 唯一约束必须存在,且 ON CONFLICT ON CONSTRAINT constraint_name 中的名称要完全匹配 \d table_name 输出的约束名
  • 如果想按部分字段冲突(比如只看 (user_id, date)),必须提前建复合唯一索引:CREATE UNIQUE INDEX idx_user_date ON events (user_id, date)
  • DO UPDATE SET x = EXCLUDED.x 中的 EXCLUDED 是关键字,代表本次 INSERT 尝试插入的那行数据,不是 SELECT 的别名

最易被忽略的是:PostgreSQL 的 ON CONFLICT 不支持延迟约束(deferred constraints)触发,如果业务依赖此行为,得换用 MERGE(v15+)或拆成两个语句。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

943

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

334

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

375

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

1656

2024.03.06

sql procedure语法错误解决方法
sql procedure语法错误解决方法

sql procedure语法错误解决办法:1、仔细检查错误消息;2、检查语法规则;3、检查括号和引号;4、检查变量和参数;5、检查关键字和函数;6、逐步调试;7、参考文档和示例。想了解更多语法错误的相关内容,可以阅读本专题下面的文章。

369

2024.03.06

oracle数据库运行sql方法
oracle数据库运行sql方法

运行sql步骤包括:打开sql plus工具并连接到数据库。在提示符下输入sql语句。按enter键运行该语句。查看结果,错误消息或退出sql plus。想了解更多oracle数据库的相关内容,可以阅读本专题下面的文章。

1211

2024.04.07

sql中where的含义
sql中where的含义

sql中where子句用于从表中过滤数据,它基于指定条件选择特定的行。想了解更多where的相关内容,可以阅读本专题下面的文章。

583

2024.04.29

sql中删除表的语句是什么
sql中删除表的语句是什么

sql中用于删除表的语句是drop table。语法为drop table table_name;该语句将永久删除指定表的表和数据。想了解更多sql的相关内容,可以阅读本专题下面的文章。

434

2024.04.29

pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法
pixiv网页版官网登录与阅读指南_pixiv官网直达入口与在线访问方法

本专题系统整理pixiv网页版官网入口及登录访问方式,涵盖官网登录页面直达路径、在线阅读入口及快速进入方法说明,帮助用户高效找到pixiv官方网站,实现便捷、安全的网页端浏览与账号登录体验。

76

2026.02.13

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号