0

0

导入时遇到MySQL崩溃重启怎么办_内存限制与单次批量大小优化

P粉602998670

P粉602998670

发布时间:2026-03-19 08:17:03

|

282人浏览过

|

来源于php中文网

原创

MySQL导入崩溃主因是innodb_buffer_pool_size超限或max_allowed_packet不足,需按物理内存50%~60%设缓冲池、调大packet值,并控制单次导入行数与VALUES括号量。

MySQL 导入时突然崩溃重启,大概率是 innodb_buffer_pool_size 超限或 max_allowed_packet 被击穿

mysql 在大批量导入(比如 load data infile 或大事务 insert)时崩溃重启,不是磁盘满、也不是权限错,八成是内存被撑爆了。innodb 缓冲池吃掉主内存大头,而单条 sql 包体过大又会卡在解析阶段——这两处一叠加,mysqld 进程直接被 oom killer 杀掉,日志里能看到 killed processout of memory

实操建议:

Felvin
Felvin

AI无代码市场,只需一个提示快速构建应用程序

下载
  • 检查崩溃前最后一条导入语句:如果它包含超长文本字段(如 JSON、base64)、或单次插入上万行,优先怀疑 max_allowed_packet 不够(默认 4MB),需在 my.cnf 中调大,例如 max_allowed_packet = 256M,改完必须重启 MySQL
  • free -hps aux --sort=-%mem | head -5 确认系统是否真内存不足;若 mysqld 占用接近 innodb_buffer_pool_size 设置值,且该值超过物理内存的 70%,就危险了
  • 不要盲目调高 innodb_buffer_pool_size —— 它不是越大越好。Linux 下若设置过高,会导致 swap 频繁或直接触发 OOM。稳妥做法是设为物理内存的 50%~60%,并预留至少 2GB 给系统和其他进程

LOAD DATA INFILE 单次导入多少行最稳?别信“10 万行”,看数据宽度和索引数量

所谓“单次 10 万行安全”,只在纯数字、无索引、无外键的宽表上可能成立。真实业务表往往带多个二级索引、TEXT 字段、触发器,每行实际内存开销可能是表面上的 3–5 倍。MySQL 内部会为每行构建临时索引项、维护 undo log、计算 checksum,批量越大,锁持有时间越长,buffer pool 压力越陡峭。

实操建议:

  • SHOW CREATE TABLE 查清表结构:每多一个二级索引,单行写入成本线性上升;有 FULLTEXTSPATIAL 索引,务必把批量降到 5k 行以内
  • 导入前临时禁用非必要索引:ALTER TABLE t1 DISABLE KEYS(仅 MyISAM 有效)不适用于 InnoDB;InnoDB 正确做法是删掉次要索引,导入完成再重建
  • 按列宽估算单行体积:比如一行含 3 个 VARCHAR(2000) + 1 个 TEXT,平均占 8KB,那 5 万行 ≈ 400MB 内存压力 —— 已逼近多数 16GB 服务器的安全阈值

INSERT ... VALUES (),(),... 批量插入时,括号数不是越多越好

很多人以为拼得越长越快,结果发现 10 万组 () 一执行就卡死甚至崩溃。问题不在行数,而在 MySQL 解析器对单条语句的 token 数和内存分配有隐式限制。过长的 VALUES 列表会让解析器在构建语法树阶段就耗尽栈空间,报错类似 ERROR 139 或直接断连。

实操建议:

  • 单条 INSERTVALUES 括号数控制在 1000–5000 之间较稳妥;具体上限取决于字段数:10 列以下可用 5000,20 列以上建议压到 1000
  • 避免在语句中混用函数或子查询(如 NOW()(SELECT id FROM t2 WHERE ...)),它们会让优化器放弃批量优化路径,退化成逐行处理
  • mysql --local-infile=1 配合 LOAD DATA,比拼接 INSERT 快 5–10 倍,且内存更可控 —— 因为数据流式读取,不全加载进 SQL 解析器

导入中途崩溃后怎么续传?别依赖 AUTO_INCREMENT,用显式位点+唯一约束兜底

LAST_INSERT_ID() 或查最大 ID 续传,看似简单,实则埋雷:并发写入、删除、手动插入都会让 ID 不连续;更糟的是,如果崩溃发生在事务提交前,部分行已落盘但事务未提交,重跑会报 Duplicate entry 错误却无法判断哪些已成功。

实操建议:

  • 导入前加个状态字段,比如 import_status TINYINT DEFAULT 0(0=未导入,1=已导入),每次插入都带 ON DUPLICATE KEY UPDATE import_status = VALUES(import_status),避免重复失败
  • 用文件偏移或行号做位点:把 CSV 每行加序号,导入脚本记录最后成功处理的行号,下次从该行继续;比依赖数据库自增更可靠
  • 确保目标表有唯一约束(如业务主键或组合唯一索引),否则续传时无法识别重复,容易脏数据

真正麻烦的不是崩一次,而是崩在没开 binlog 或没设 innodb_flush_log_at_trx_commit = 1 的实例上——这时候连崩溃前最后几秒的数据都可能丢失,恢复只能靠原始文件重放。别省这点 IO 开销。

相关标签:

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
大数据分析工具有哪四个
大数据分析工具有哪四个

大数据分析的四个工具分别是rapidminer、Hpcc、Hadoop和Pentaho bi。大数据分析用于从各种来源生成的原始数据中提取有价值的数据。这些数据帮助我们获得有意义的见解、隐藏的模式、未知的相关性、市场趋势等等,具体取决于行业。大数据分析的主要动机是提供有价值的见解,以便为未来做出更好的决策。php中文网为大家带来了大数据分析的相关教程、以及相关文章等内容,供大家免费下载使用。

166

2023.06.21

Java 大数据处理基础(Hadoop 方向)
Java 大数据处理基础(Hadoop 方向)

本专题聚焦 Java 在大数据离线处理场景中的核心应用,系统讲解 Hadoop 生态的基本原理、HDFS 文件系统操作、MapReduce 编程模型、作业优化策略以及常见数据处理流程。通过实际示例(如日志分析、批处理任务),帮助学习者掌握使用 Java 构建高效大数据处理程序的完整方法。

786

2025.12.08

大数据专业学习教程
大数据专业学习教程

本专题整合了大数据专业学习相关教程,阅读专题下面的文章了解更多详细内容。

36

2026.01.05

python处理大数据合集
python处理大数据合集

本专题整合了python处理大数据相关教程,阅读专题下面的文章了解更多详细内容。

112

2026.01.05

数据分析工具有哪些
数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍:1、Excel,具有强大的计算和数据处理功能;2、SQL,可以进行数据查询、过滤、排序、聚合等操作;3、Python,拥有丰富的数据分析库;4、R,拥有丰富的统计分析库和图形库;5、Tableau,提供了直观易用的用户界面等等。

1135

2023.10.12

SQL中distinct的用法
SQL中distinct的用法

SQL中distinct的语法是“SELECT DISTINCT column1, column2,...,FROM table_name;”。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

340

2023.10.27

SQL中months_between使用方法
SQL中months_between使用方法

在SQL中,MONTHS_BETWEEN 是一个常见的函数,用于计算两个日期之间的月份差。想了解更多SQL的相关内容,可以阅读本专题下面的文章。

381

2024.02.23

SQL出现5120错误解决方法
SQL出现5120错误解决方法

SQL Server错误5120是由于没有足够的权限来访问或操作指定的数据库或文件引起的。想了解更多sql错误的相关内容,可以阅读本专题下面的文章。

2300

2024.03.06

Python WebSocket实时通信与异步服务开发实践
Python WebSocket实时通信与异步服务开发实践

本专题聚焦 Python 在实时通信场景中的开发实践,系统讲解 WebSocket 协议原理、长连接管理、消息推送机制以及异步服务架构设计。内容包括客户端与服务端通信实现、连接稳定性优化、消息队列集成及高并发处理策略。通过完整案例,帮助开发者构建高效稳定的实时通信系统,适用于聊天应用、实时数据推送等场景。

7

2026.03.18

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号