如何防止MongoDB GridFS被恶意刷入大量无用文件

P粉602998670

发布时间：2026-03-18 06:29:09

360人浏览过

来源于php中文网

原创

GridFS上传必须校验元信息、使用GridFSBucket、绑定身份配额、预读校验大小、定期清理孤儿块；filename限255字符且禁路径遍历符，contentType须白名单，metadata需防深层嵌套与非法键名。

如何防止mongodb gridfs被恶意刷入大量无用文件

GridFS 上传前必须校验文件元信息

不校验 filename、contentType 和 metadata，攻击者就能用随机字符串或超长路径名反复写入，撑爆 fs.files 集合。MongoDB 本身不限制文件名长度或格式，但业务侧必须拦住明显异常的值。

filename 应限制在 255 字符内，且禁止 /、../、控制字符、Unicode 零宽空格等路径遍历或混淆符号
contentType 必须白名单校验，例如只允许 "image/jpeg"、"application/pdf" 等已知合法类型，不能只靠客户端传入的值
metadata 字段若开放写入，需递归检查嵌套层级（避免深度 > 5）和键名（禁止 $ 开头或 . 出现在键中）

用 GridFSBucket 而非原始 collection 操作

直接往 fs.files 和 fs.chunks 插文档等于绕过所有安全钩子，连基本的 chunk 大小校验都失效。官方 GridFSBucket 类封装了原子写入、分块校验和自动 cleanup，是唯一可控入口。

永远不要用 db.fs.files.insertOne() 手动插入元数据文档
上传必须走 bucket.uploadFromStream()，并设置 chunkSizeBytes（建议 256KB，太小增加 chunk 数量，太大拖慢单次写入）
启用 disableMD5（默认 true），避免 MD5 计算成为 DoS 攻击面

上传接口必须绑定身份与配额

GridFS 本身无权限模型，全靠上层服务控制。一个未鉴权或弱鉴权的上传端点，几行脚本就能打满磁盘。

提客AI提词器

「直播、录课」智能AI提词，搭配抖音直播伴侣、腾讯会议、钉钉、飞书、录课等软件等任意软件。

下载

每个上传请求必须关联明确用户 ID 或 API Key，并在 DB 中维护该主体的 daily_upload_count 和 total_size_bytes
上传前查 Redis 缓存做秒级限流（如 INCR user:123:upload:20240520 + EXPIRE），比查 MongoDB 快一个数量级
文件大小必须在内存中预读前 1MB 校验（不是只看 Content-Length header，它可被伪造），超过阈值（如 100MB）直接 413

定期清理 orphaned chunks 是硬性运维动作

上传中断、客户端崩溃或代码 bug 都会导致 fs.chunks 里残留没有对应 fs.files 文档的块——这些“孤儿块”不会被自动回收，积少成多直接吃光磁盘空间。

每周跑一次 db.runCommand({ cleanUpOrphaned: "fs.chunks" })（MongoDB 4.2+）
低版本需手写脚本：查出 fs.chunks.files_id 不在 fs.files._id 中的所有 chunk，再批量删除
清理前务必备份，命令执行期间会阻塞写入，安排在业务低峰期

最麻烦的不是配置，而是把「上传校验」和「配额扣减」做成原子操作——很多人用两个独立 DB 请求实现，中间失败就会导致配额没扣但文件已存，或者反之。这得靠事务或 Lua 脚本兜底，别图省事跳过去。

相关标签:

lua 封装字符串递归接口 Length Collection redis mongodb bug

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：怎么查看MongoDB副本集的同步延迟_rs.printSlaveReplicationInfo()分析下一篇：暂无

作者最新文章

宝塔面板安装后如何设置面板的访问白名单规则？

2026-03-17 18:54

Win11怎么自定义开始菜单_固定应用与文件夹快捷方式

2026-03-17 18:55

如何在Golang中利用Heap实现优先队列 Go语言container/heap接口实战

2026-03-17 18:56

如何在Golang中实现Web服务的健康检查 Go语言K8s就绪与存活探针

2026-03-17 18:56

如何在Golang中避免不必要的指针使用 Go语言值传递优化技巧

2026-03-17 18:57

如何在宝塔面板中管理多PHP版本的环境变量？

2026-03-17 18:59

如何在Golang中实现自动化的CI/CD流水线 Go语言结合GitHub Actions实战

2026-03-17 18:59

如何在Golang中实现数据库事务的回滚 Go语言Tx.Rollback错误处理

2026-03-17 19:00

如何在Golang中构建静态链接的可执行文件 Go语言CGO_ENABLED禁用技巧

2026-03-17 19:00

如何在Golang中正确使用Goto跳转语句 Go语言流程控制最佳实践

2026-03-17 19:00

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

js 字符串转数组

js字符串转数组的方法：1、使用“split()”方法；2、使用“Array.from()”方法；3、使用for循环遍历；4、使用“Array.split()”方法。本专题为大家提供js字符串转数组的相关的文章、下载、课程内容，供大家免费下载体验。

761

2023.08.03

js截取字符串的方法

js截取字符串的方法有substring()方法、substr()方法、slice()方法、split()方法和slice()方法。本专题为大家提供字符串相关的文章、下载、课程内容，供大家免费下载体验。

221

2023.09.04

java基础知识汇总

java基础知识有Java的历史和特点、Java的开发环境、Java的基本数据类型、变量和常量、运算符和表达式、控制语句、数组和字符串等等知识点。想要知道更多关于java基础知识的朋友，请阅读本专题下面的的有关文章，欢迎大家来php中文网学习。

1571

2023.10.24

字符串介绍

字符串是一种数据类型，它可以是任何文本，包括字母、数字、符号等。字符串可以由不同的字符组成，例如空格、标点符号、数字等。在编程中，字符串通常用引号括起来，如单引号、双引号或反引号。想了解更多字符串的相关内容，可以阅读本专题下面的文章。

651

2023.11.24

java读取文件转成字符串的方法

Java8引入了新的文件I/O API，使用java.nio.file.Files类读取文件内容更加方便。对于较旧版本的Java，可以使用java.io.FileReader和java.io.BufferedReader来读取文件。在这些方法中，你需要将文件路径替换为你的实际文件路径，并且可能需要处理可能的IOException异常。想了解更多java的相关内容，可以阅读本专题下面的文章。

1269

2024.03.22