怎么从MySQL的Blob平滑迁移数据到MongoDB GridFS

P粉602998670

发布时间：2026-03-15 09:05:31

337人浏览过

来源于php中文网

原创

MySQL读大BLOB应先查长度筛选，再流式读取；GridFS需规范设置filename、contentType、metadata；迁移用log表续传；删除后需compact回收空间；跨服务须抽象存储适配层。

怎么从mysql的blob平滑迁移数据到mongodb gridfs

MySQL `BLOB` 字段读取时内存爆掉怎么办

直接 SELECT 大 BLOB 字段（比如几百 MB 的视频或 PDF）会把整块二进制塞进 PHP/Python 进程内存，OOM 是常态。不是 MySQL 慢，是你没绕开它。

用 SELECT id, LENGTH(data) as size FROM table 先查尺寸，筛掉超限文件（比如 >50MB）
Java 用 ResultSet.getBinaryStream()；Python 用 cursor.fetchone()[1] 配合 chunked reading（别一次性 .read()）
PHP 的 mysqli::use_result() + mysqli_result::fetch_row() 流式读，避免 store_result()

MongoDB GridFS 写入前必须处理的三个字段

GridFS 不是“扔进去就完事”，filename、contentType、metadata 这仨不设好，后续查不到、下不了、权限对不上。

filename 别用原始 MySQL 的 id 或数字名——加后缀，比如 "report_12345.pdf"，否则下载时浏览器不会识别类型
contentType 不能靠扩展名猜，得从 BLOB 前几个字节用 file -b --mime-type 或 Python 的 python-magic 实测，否则前端 Content-Type 错，PDF 打不开
metadata 字段里存 MySQL 原记录 ID（如 {"mysql_id": 12345}），不然迁移后彻底失联

迁移脚本跑一半挂了怎么续传

GridFS 的 _id 是 ObjectId，但 MySQL 的主键是数字，两者无天然映射。硬靠时间戳或自增 ID 对齐，失败后无法判断哪条漏了。

Giiso写作机器人

Giiso写作机器人，让写作更简单

下载

在 MongoDB 新建一张 migration_log 集合，每写入一个文件就插一条：{"mysql_id": 12345, "gridfs_id": ObjectId("..."), "status": "done"}
脚本启动时先查 migration_log 中 status: "done" 的最大 mysql_id，然后从下一条继续 SELECT ... WHERE id > ?
别用 try/except 吞掉所有异常——至少把失败的 mysql_id 记进日志文件，人工可查

GridFS 文件删除后磁盘空间不释放？

这是最隐蔽的坑：GridFS 删除只是删了 fs.files 和 fs.chunks 里的文档，MongoDB 不会立刻回收磁盘，db.fs.chunks.totalSize() 可能远大于实际占用。

确认删干净：查 db.fs.files.find({"metadata.mysql_id": 12345}) 和 db.fs.chunks.find({"files_id": ObjectId("...")}) 都为空
空间回收要等后台 compact 或 repairDatabase（仅 WiredTiger 引擎支持在线 compact）
生产环境别用 mongod --repair，停机太久；优先用 db.runCommand({compact: "fs.chunks"})，但注意它会短暂锁表

真正麻烦的是跨服务引用——MySQL 里存着 BLOB ID，应用代码却直接读 MongoDB GridFS，中间没抽象层。一旦 GridFS 路径或权限变，全量改代码。留个 storage_adapter 接口比省事重要得多。

相关标签:

mysql select try mysqli 接口 Length table mongodb

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：MongoDB GridFS在并发高时为什么容易发生锁等待下一篇：暂无

作者最新文章

悟空浏览器怎么关闭启动时的加载动画闪屏_悟空浏览器秒开优化

2026-03-13 17:04

如何在Golang中通过反射创建并操作切片 Go语言reflect.MakeSlice实战

2026-03-13 17:05

如何避免PL/SQL中的SQL注入_绑定变量Bind Variables的最佳实践

2026-03-13 17:05

Safari浏览器如何关闭网页的安全证书警告_Safari浏览器继续访问

2026-03-13 17:06

宝塔面板下如何安装Node.js的特定版本镜像源？

2026-03-13 17:09

如何在Golang中实现优雅的请求超时控制 Go语言http.TimeoutHandler使用

2026-03-13 17:09

如何在Golang中利用Trace工具分析延迟 Go语言执行链路可视化追踪

2026-03-13 17:09

如何在Golang中利用SQLite进行本地存储 Go语言嵌入式数据库应用

2026-03-13 17:11

如何在Golang中利用Finalizer清理非内存资源 Go语言runtime.SetFinalizer使用

2026-03-13 17:11

如何为Oracle配置多监听器_不同端口的并发监听机制实现

2026-03-13 17:12

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

mysql修改数据表名

MySQL修改数据表：1、首先查看数据库中所有的表，代码为：‘SHOW TABLES；’；2、修改表名，代码为：‘ALTER TABLE 旧表名 RENAME [TO] 新表名；’。php中文网还提供MySQL的相关下载、相关课程等内容，供大家免费下载使用。

686

2023.06.20

MySQL创建存储过程

存储程序可以分为存储过程和函数，MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名)，也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容，供大家免费下载使用。

534

2023.06.21

mongodb和mysql的区别

mongodb和mysql的区别：1、数据模型；2、查询语言；3、扩展性和性能；4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容，供大家免费下载体验。

287

2023.07.18

mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

519

2023.07.19

mysql创建数据库

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

267

2023.07.25