0

0

GridFS:基于MongoDB的分布式文件存储系统

php中文网

php中文网

发布时间:2016-06-07 17:29:50

|

1282人浏览过

|

来源于php中文网

原创

GridFS是MongoDB之上的分布式文件系统,其利用了MongoDB的分布式存储机制并通过MongoDB来存储文件数据和文件元数据,兼具文档型数

gridfs是mongodb之上的分布式文件系统,其利用了mongodb的分布式存储机制并通过mongodb来存储文件数据和文件元数据,兼具文档型数据库和文件系统的优势。gridfs是当前大数据潮流和复杂数据分析需求的产物。
 
简单来说,gridfs通过将文件数据和文件元数据保存在mongodb里来实现文件系统,通过复制(replication)来应对故障切换,数据集成,还可以用来做读扩展,热备份或者作为离线批处理的数据源,通过分片来实现自动切分数据,实现大数据存储和负载均衡,通过数据库对集合中文档的管理和查询(包括mapreduce)实现轻量级文件系统接口和搜索与分析。
 
gridfs的一个基本思想是可以将大文件分成很多块,每一块作为一个单独的文档存储,则有就能存储大文件了。由于mongodb支持在文档中存储二进制数据,可以最大限度减小块的存储开销。gridfs使用mongodb的复制,分片等机制来实现分布式文件存储,使用mongodb进行管理和复杂分析。
 
gridfs使用两个文档来存储文件,一个用来存储文件本身的块,另外一个用来存储分块的信息和文件的元数据,默认对应的集合分别为fs.chunks和fs.files.
 
chunks集合:
 
{
 
“_id”:,
 
“files_id”: ,
 
“n”: ,
 
“data”:
 
}
 
块集合中文档包含以下属性:chunk_id:块id。chunks.files_id:对应files集合中文档的_id。chunks.n:块的编号,由gridfs管理,从0开始。chunks.data:文件数据,是bson二进制类型。
 
chunks集合使用files_id和n作为混合索引,files集合:
 
{
 
“_id”: ,
 
“length”: ,
 
“chunksize”:,
 
“uploaddate”: ,
 
“md5”: ,
 
“filename”: ,
 
“contenttype”: ,
 
“aliases”: ,
 
“metadata”:
 
}
 
files集合中的文档包含以下属性,应用还可以创建额外任意的属性:files_id:唯一的文件表示。mongodb的默认值是bosn objectid。files.length: 文件的字节数大小。files.chunksize:每个块的大小,默认为256kb,gridfs根据这个值将文件分成多个快,files.uploaddate:gridfs第一次存储此文件的时间,类型为isodate。files.md5: 文件的md5散列值,是字符串。 files.filename:可选。人类可读的文件名。files.contenttype: 可选。合法的文件mime类型。files.aliases:可选。别名的字符串数组。files.metadata:可选。自定义存储的文件元数据。
 
可以通过mongofiles工具或者mongodb驱动程序来使用gridfs,gridfs主要提供5种操作接口:
 
list:获取文件列表
 
get:获取文件
 
put:写入文件
 
search:根据文件名搜索文件
 
delete:删除文件
 
因为gridfs文件的元数据存储在files集合中,因此gridfs可以非常方便地进行文件管理,比如根据文件名,上传时间,文件大小或者自定义的文件元数据进行查询,还可以利用mapreduce做复杂数据分析。这是gridfs把传统文件系统和数据库相结合得到的众多好处之一。
 
对比传统文件系统的优势
 
分布式:gridfs是基于mongodb的分布式文件系统,可以直接使用mongodb replication和sharding机制,数据可靠性和水平扩展性都得到保证。gridfs不产生磁盘碎片,因为mongodb分配数据文件空间时以2gb为一块。
 
mapreduce:可以进行复杂管理和查询分析。
 
索引和缓存:元数据存储在mongodb中,非常方便索引,,并且可以对文件和文件元数据进行索引,能提高系统效率。
 
checksum: gridfs会为文件产生散列值,可用于校验文件以检查完整性。
 
开发者友好:利用grid可以简化需求,减小开发成本。要是已经用了mongodb,gridfs就可以不需要使用独立文件存储架构,并且使代码和数据真正分离,方便管理。
 
其他: gridfs可以避免用于存储用户上传内容的文件系统出现的某些问题。例如,gridfs在同一个目录下防止大量的文件是没有任何问题的。gridfs不产生磁盘碎片,因为mongodb分配数据文件空间时以2gb为一块。

linux

华友协同办公自动化OA系统
华友协同办公自动化OA系统

华友协同办公管理系统(华友OA),基于微软最新的.net 2.0平台和SQL Server数据库,集成强大的Ajax技术,采用多层分布式架构,实现统一办公平台,功能强大、价格便宜,是适用于企事业单位的通用型网络协同办公系统。 系统秉承协同办公的思想,集成即时通讯、日记管理、通知管理、邮件管理、新闻、考勤管理、短信管理、个人文件柜、日程安排、工作计划、工作日清、通讯录、公文流转、论坛、在线调查、

下载

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

0

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

101

2026.01.26

edge浏览器怎样设置主页 edge浏览器自定义设置教程
edge浏览器怎样设置主页 edge浏览器自定义设置教程

在Edge浏览器中设置主页,请依次点击右上角“...”图标 > 设置 > 开始、主页和新建标签页。在“Microsoft Edge 启动时”选择“打开以下页面”,点击“添加新页面”并输入网址。若要使用主页按钮,需在“外观”设置中开启“显示主页按钮”并设定网址。

12

2026.01.26

苹果官方查询网站 苹果手机正品激活查询入口
苹果官方查询网站 苹果手机正品激活查询入口

苹果官方查询网站主要通过 checkcoverage.apple.com/cn/zh/ 进行,可用于查询序列号(SN)对应的保修状态、激活日期及技术支持服务。此外,查找丢失设备请使用 iCloud.com/find,购买信息与物流可访问 Apple (中国大陆) 订单状态页面。

77

2026.01.26

npd人格什么意思 npd人格有什么特征
npd人格什么意思 npd人格有什么特征

NPD(Narcissistic Personality Disorder)即自恋型人格障碍,是一种心理健康问题,特点是极度夸大自我重要性、需要过度赞美与关注,同时极度缺乏共情能力,背后常掩藏着低自尊和不安全感,影响人际关系、工作和生活,通常在青少年时期开始显现,需由专业人士诊断。

5

2026.01.26

windows安全中心怎么关闭 windows安全中心怎么执行操作
windows安全中心怎么关闭 windows安全中心怎么执行操作

关闭Windows安全中心(Windows Defender)可通过系统设置暂时关闭,或使用组策略/注册表永久关闭。最简单的方法是:进入设置 > 隐私和安全性 > Windows安全中心 > 病毒和威胁防护 > 管理设置,将实时保护等选项关闭。

6

2026.01.26

2026年春运抢票攻略大全 春运抢票攻略教你三招手【技巧】
2026年春运抢票攻略大全 春运抢票攻略教你三招手【技巧】

铁路12306提供起售时间查询、起售提醒、购票预填、候补购票及误购限时免费退票五项服务,并强调官方渠道唯一性与信息安全。

92

2026.01.26

个人所得税税率表2026 个人所得税率最新税率表
个人所得税税率表2026 个人所得税率最新税率表

以工资薪金所得为例,应纳税额 = 应纳税所得额 × 税率 - 速算扣除数。应纳税所得额 = 月度收入 - 5000 元 - 专项扣除 - 专项附加扣除 - 依法确定的其他扣除。假设某员工月工资 10000 元,专项扣除 1000 元,专项附加扣除 2000 元,当月应纳税所得额为 10000 - 5000 - 1000 - 2000 = 2000 元,对应税率为 3%,速算扣除数为 0,则当月应纳税额为 2000×3% = 60 元。

24

2026.01.26

oppo云服务官网登录入口 oppo云服务登录手机版
oppo云服务官网登录入口 oppo云服务登录手机版

oppo云服务https://cloud.oppo.com/可以在云端安全存储您的照片、视频、联系人、便签等重要数据。当您的手机数据意外丢失或者需要更换手机时,可以随时将这些存储在云端的数据快速恢复到手机中。

68

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MongoDB 教程
MongoDB 教程

共17课时 | 2.4万人学习

黑马云课堂mongodb实操视频教程
黑马云课堂mongodb实操视频教程

共11课时 | 3.1万人学习

MongoDB 教程
MongoDB 教程

共42课时 | 27.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号