讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架人工智能 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 AI 提示词

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

搭建高可用mongodb集群（四）分片

php中文网

php中文网

发布时间：2016-06-07 15:54:24

|

1316人浏览过

|

来源于php中文网

原创

按照上一节中《搭建高可用mongodb集群（三）深入副本集》搭建后还有两个问题没有解决：从节点每个上面的数据都是对数据库全量拷贝，从节点压力会不会过大？数据压力大到机器支撑不了的时候能否做到自动扩展？在系统早期，数据量还小的时候不会引起太大的

按照上一节中《搭建高可用mongodb集群（三）—— 深入副本集》搭建后还有两个问题没有解决：

从节点每个上面的数据都是对数据库全量拷贝，从节点压力会不会过大？
数据压力大到机器支撑不了的时候能否做到自动扩展？
在系统早期，数据量还小的时候不会引起太大的问题，但是随着数据量持续增多，后续迟早会出现一台机器硬件瓶颈问题的。而mongodb主打的就是海量数据架构，他不能解决海量数据怎么行！不行！“分片”就用这个来解决这个问题。

传统数据库怎么做海量数据读写？其实一句话概括：分而治之。上图看看就清楚了，如下 taobao岳旭强在infoq中提到的架构图：

上图中有个TDDL，是taobao的一个数据访问层组件，他主要的作用是SQL解析、路由处理。根据应用的请求的功能解析当前访问的sql判断是在哪个业务数据库、哪个表访问查询并返回数据结果。具体如图：

说了这么多传统数据库的架构，那Nosql怎么去做到了这些呢？mysql要做到自动扩展需要加一个数据访问层用程序去扩展，数据库的增加、删除、备份还需要程序去控制。一但数据库的节点一多，要维护起来也是非常头疼的。不过mongodb所有的这一切通过他自己的内部机制就可以搞定！顿时石化了，这么牛X！还是上图看看mongodb通过哪些机制实现路由、分片：

从图中可以看到有四个组件：mongos、config server、shard、replica set。

mongos，数据库集群请求的入口，所有的请求都通过mongos进行协调，不需要在应用程序添加一个路由选择器，mongos自己就是一个请求分发中心，它负责把对应的数据请求请求转发到对应的shard服务器上。在生产环境通常有多mongos作为请求的入口，防止其中一个挂掉所有的mongodb请求都没有办法操作。

config server，顾名思义为配置服务器，存储所有数据库元信息（路由、分片）的配置。mongos本身没有物理存储分片服务器和数据路由信息，只是缓存在内存里，配置服务器则实际存储这些数据。mongos第一次启动或者关掉重启就会从 config server 加载配置信息，以后如果配置服务器信息变化会通知到所有的 mongos 更新自己的状态，这样 mongos 就能继续准确路由。在生产环境通常有多个 config server 配置服务器，因为它存储了分片路由的元数据，这个可不能丢失！就算挂掉其中一台，只要还有存货， mongodb集群就不会挂掉。

shard，这就是传说中的分片了。上面提到一个机器就算能力再大也有天花板，就像军队打仗一样，一个人再厉害喝血瓶也拼不过对方的一个师。俗话说三个臭皮匠顶个诸葛亮，这个时候团队的力量就凸显出来了。在互联网也是这样，一台普通的机器做不了的多台机器来做，如下图：

一台机器的一个数据表 Collection1 存储了 1T 数据，压力太大了！在分给4个机器后，每个机器都是256G，则分摊了集中在一台机器的压力。也许有人问一台机器硬盘加大一点不就可以了，为什么要分给四台机器呢？不要光想到存储空间，实际运行的数据库还有硬盘的读写、网络的IO、CPU和内存的瓶颈。在mongodb集群只要设置好了分片规则，通过mongos操作数据库就能自动把对应的数据操作请求转发到对应的分片机器上。在生产环境中分片的片键可要好好设置，这个影响到了怎么把数据均匀分到多个分片机器上，不要出现其中一台机器分了1T，其他机器没有分到的情况，这样还不如不分片！

replica set，上两节已经详细讲过了这个东东，怎么这里又来凑热闹！其实上图4个分片如果没有 replica set 是个不完整架构，假设其中的一个分片挂掉那四分之一的数据就丢失了，所以在高可用性的分片架构还需要对于每一个分片构建 replica set 副本集保证分片的可靠性。生产环境通常是 2个副本 + 1个仲裁。

说了这么多，还是来实战一下如何搭建高可用的mongodb集群：

首先确定各个组件的数量，mongos 3个， config server 3个，数据分3片 shard server 3个，每个shard 有一个副本一个仲裁也就是 3 * 2 = 6 个，总共需要部署15个实例。这些实例可以部署在独立机器也可以部署在一台机器，我们这里测试资源有限，只准备了 3台机器，在同一台机器只要端口不同就可以，看一下物理部署图：

架构搭好了，安装软件！

1、准备机器，IP分别设置为： 192.168.0.136、192.168.0.137、192.168.0.138。

2、分别在每台机器上建立mongodb分片对应测试文件夹。

#存放mongodb数据文件
mkdir -p /data/mongodbtest

#进入mongodb文件夹
cd /data/mongodbtest

3、下载mongodb的安装程序包

wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.4.8.tgz

citySHOP 多用户商城
citySHOP是一款集CMS、网店、商品、系统，管理更加科学快速；全新Jquery前端引擎；智能缓存、图表化的数据分析，手机短信营销；各种礼包设置、搭配购买、关联等进一步加强用户体验；任何功能及设置都高度自定义；MVC架构模式，代码严禁、规范；商品推荐、促销、礼包、折扣、换购等多种设置模式；商品五级分类，可自由设置分类属性；商品展示页简介大方，清晰，图片自动放大，无需重开页面；商品评价、咨询分开

下载

#解压下载的压缩包
tar xvzf mongodb-linux-x86_64-2.4.8.tgz

4、分别在每台机器建立mongos 、config 、 shard1 、shard2、shard3 五个目录。
因为mongos不存储数据，只需要建立日志文件目录即可。

#建立mongos目录
mkdir -p /data/mongodbtest/mongos/log

#建立config server 数据文件存放目录
mkdir -p /data/mongodbtest/config/data

#建立config server 日志文件存放目录
mkdir -p /data/mongodbtest/config/log

#建立config server 日志文件存放目录
mkdir -p /data/mongodbtest/mongos/log

#建立shard1 数据文件存放目录
mkdir -p /data/mongodbtest/shard1/data

#建立shard1 日志文件存放目录
mkdir -p /data/mongodbtest/shard1/log

#建立shard2 数据文件存放目录
mkdir -p /data/mongodbtest/shard2/data

#建立shard2 日志文件存放目录
mkdir -p /data/mongodbtest/shard2/log

#建立shard3 数据文件存放目录
mkdir -p /data/mongodbtest/shard3/data

#建立shard3 日志文件存放目录
mkdir -p /data/mongodbtest/shard3/log

5、规划5个组件对应的端口号，由于一个机器需要同时部署 mongos、config server 、shard1、shard2、shard3，所以需要用端口进行区分。
这个端口可以自由定义，在本文 mongos为 20000， config server 为 21000， shard1为 22001 ， shard2为22002， shard3为22003.

6、在每一台服务器分别启动配置服务器。

/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongod –configsvr –dbpath /data/mongodbtest/config/data –port 21000 –logpath /data/mongodbtest/config/log/config.log –fork

7、在每一台服务器分别启动mongos服务器。

/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongos –configdb 192.168.0.136:21000,192.168.0.137:21000,192.168.0.138:21000 –port 20000 –logpath /data/mongodbtest/mongos/log/mongos.log –fork

8、配置各个分片的副本集。

#在每个机器里分别设置分片1服务器及副本集shard1
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongod –shardsvr –replSet shard1 –port 22001 –dbpath /data/mongodbtest/shard1/data –logpath /data/mongodbtest/shard1/log/shard1.log –fork –nojournal –oplogSize 10

为了快速启动并节约测试环境存储空间，这里加上 nojournal 是为了关闭日志信息，在我们的测试环境不需要初始化这么大的redo日志。同样设置 oplogsize是为了降低 local 文件的大小，oplog是一个固定长度的 capped collection,它存在于”local”数据库中,用于记录Replica Sets操作日志。注意，这里的设置是为了测试！

#在每个机器里分别设置分片2服务器及副本集shard2
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongod –shardsvr –replSet shard2 –port 22002 –dbpath /data/mongodbtest/shard2/data –logpath /data/mongodbtest/shard2/log/shard2.log –fork –nojournal –oplogSize 10

#在每个机器里分别设置分片3服务器及副本集shard3
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongod –shardsvr –replSet shard3 –port 22003 –dbpath /data/mongodbtest/shard3/data –logpath /data/mongodbtest/shard3/log/shard3.log –fork –nojournal –oplogSize 10

分别对每个分片配置副本集，深入了解副本集参考本系列前几篇文章。

任意登陆一个机器，比如登陆192.168.0.136，连接mongodb

#设置第一个分片副本集
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongo 127.0.0.1:22001

#使用admin数据库
use admin

#定义副本集配置
config = { _id:“shard1”, members:[

1 {_id:0,host:"192.168.0.136:22001"},

2 {_id:1,host:"192.168.0.137:22001"},

3 {_id:2,host:"192.168.0.138:22001",arbiterOnly:true}

4 ]

5 }

#初始化副本集配置
rs.initiate(config);

#设置第二个分片副本集
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongo 127.0.0.1:22002

#使用admin数据库
use admin

#定义副本集配置
config = { _id:“shard2”, members:[

1 {_id:0,host:"192.168.0.136:22002"},

2 {_id:1,host:"192.168.0.137:22002"},

3 {_id:2,host:"192.168.0.138:22002",arbiterOnly:true}

4 ]

5 }

#初始化副本集配置
rs.initiate(config);

#设置第三个分片副本集
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongo 127.0.0.1:22003

#使用admin数据库
use admin

#定义副本集配置
config = { _id:“shard3”, members:[

1 {_id:0,host:"192.168.0.136:22003"},

2 {_id:1,host:"192.168.0.137:22003"},

3 {_id:2,host:"192.168.0.138:22003",arbiterOnly:true}

4 ]

5 }

#初始化副本集配置
rs.initiate(config);
9、目前搭建了mongodb配置服务器、路由服务器，各个分片服务器，不过应用程序连接到 mongos 路由服务器并不能使用分片机制，还需要在程序里设置分片配置，让分片生效。

#连接到mongos
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongo 127.0.0.1:20000

#使用admin数据库
user admin

#串联路由服务器与分配副本集1
db.runCommand( { addshard : “shard1/192.168.0.136:22001,192.168.0.137:22001,192.168.0.138:22001”});

如里shard是单台服务器，用 db.runCommand( { addshard : “[: ]” } )这样的命令加入，如果shard是副本集，用db.runCommand( { addshard : “replicaSetName/[:port][,serverhostname2[:port],…]” });这样的格式表示。

#串联路由服务器与分配副本集2
db.runCommand( { addshard : “shard2/192.168.0.136:22002,192.168.0.137:22002,192.168.0.138:22002”});

#串联路由服务器与分配副本集3
db.runCommand( { addshard : “shard3/192.168.0.136:22003,192.168.0.137:22003,192.168.0.138:22003”});

#查看分片服务器的配置
db.runCommand( { listshards : 1 } );

#内容输出
{

01 "shards" : [

02 {

03 "_id" : "shard1",

04 "host" : "shard1/192.168.0.136:22001,192.168.0.137:22001"

05 },

06 {

07 "_id" : "shard2",

08 "host" : "shard2/192.168.0.136:22002,192.168.0.137:22002"

09 },

10 {

11 "_id" : "shard3",

12 "host" : "shard3/192.168.0.136:22003,192.168.0.137:22003"

13 }

14 ],

15 "ok" : 1

}
因为192.168.0.138是每个分片副本集的仲裁节点，所以在上面结果没有列出来。

10、目前配置服务、路由服务、分片服务、副本集服务都已经串联起来了，但我们的目的是希望插入数据，数据能够自动分片，就差那么一点点，一点点。。。
连接在mongos上，准备让指定的数据库、指定的集合分片生效。

#指定testdb分片生效
db.runCommand( { enablesharding :“testdb”});

#指定数据库里需要分片的集合和片键
db.runCommand( { shardcollection : “testdb.table1”,key : {id: 1} } )

我们设置testdb的 table1 表需要分片，根据 id 自动分片到 shard1 ，shard2，shard3 上面去。要这样设置是因为不是所有mongodb 的数据库和表都需要分片！

11、测试分片配置结果。

#连接mongos服务器
/data/mongodbtest/mongodb-linux-x86_64-2.4.8/bin/mongo 127.0.0.1:20000

#使用testdb
use testdb;

#插入测试数据
for (var i = 1; i db.table1.save({id:i,“test1”:“testval1”});

#查看分片情况如下，部分无关信息省掉了
db.table1.stats();

{

01 "sharded" : true,

02 "ns" : "testdb.table1",

03 "count" : 100000,

04 "numExtents" : 13,

05 "size" : 5600000,

06 "storageSize" : 22372352,

07 "totalIndexSize" : 6213760,

08 "indexSizes" : {

09 "_id_" : 3335808,

10 "id_1" : 2877952

11 },

12 "avgObjSize" : 56,

13 "nindexes" : 2,

14 "nchunks" : 3,

15 "shards" : {

16 "shard1" : {

17 "ns" : "testdb.table1",

18 "count" : 42183,

19 "size" : 0,

20 ...

21 "ok" : 1

22 },

23 "shard2" : {

24 "ns" : "testdb.table1",

25 "count" : 38937,

26 "size" : 2180472,

27 ...

28 "ok" : 1

29 },

30 "shard3" : {

31 "ns" : "testdb.table1",

32 "count" :18880,

33 "size" : 3419528,

34 ...

35 "ok" : 1

36 }

37 },

38 "ok" : 1

}
可以看到数据分到3个分片，各自分片数量为： shard1 “count” : 42183，shard2 “count” : 38937，shard3 “count” : 18880。已经成功了！不过分的好像不是很均匀，所以这个分片还是很有讲究的，后续再深入讨论。

12、java程序调用分片集群，因为我们配置了三个mongos作为入口，就算其中哪个入口挂掉了都没关系，使用集群客户端程序如下：

public class TestMongoDBShards {

01 public static void main(String[] args) {

02

03 try {

04 List addresses = new ArrayList();

05 ServerAddress address1 = new ServerAddress("192.168.0.136" , 20000);

06 ServerAddress address2 = new ServerAddress("192.168.0.137" , 20000);

07 ServerAddress address3 = new ServerAddress("192.168.0.138" , 20000);

08 addresses.add(address1);

09 addresses.add(address2);

10 addresses.add(address3);

11

12 MongoClient client = new MongoClient(addresses);

13 DB db = client.getDB( "testdb" );

14 DBCollection coll = db.getCollection( "table1" );

15

16 BasicDBObject object = new BasicDBObject();

17 object.append( "id" , 1);

18

19 DBObject dbObject = coll.findOne(object);

20

21 System. out .println(dbObject);

22

23 } catch (Exception e) {

24 e.printStackTrace();

25 }

26 }

}
整个分片集群搭建完了，思考一下我们这个架构是不是足够好呢？其实还有很多地方需要优化，比如我们把所有的仲裁节点放在一台机器，其余两台机器承担了全部读写操作，但是作为仲裁的192.168.0.138相当空闲。让机器3 192.168.0.138多分担点责任吧！架构可以这样调整，把机器的负载分的更加均衡一点，每个机器既可以作为主节点、副本节点、仲裁节点，这样压力就会均衡很多了，如图：

当然生产环境的数据远远大于当前的测试数据，大规模数据应用情况下我们不可能把全部的节点像这样部署，硬件瓶颈是硬伤，只能扩展机器。要用好mongodb还有很多机制需要调整，不过通过这个东东我们可以快速实现高可用性、高扩展性，所以它还是一个非常不错的Nosql组件。

再看看我们使用的mongodb java 驱动客户端 MongoClient(addresses)，这个可以传入多个mongos 的地址作为mongodb集群的入口，并且可以实现自动故障转移，但是负载均衡做的好不好呢？打开源代码查看：

它的机制是选择一个ping 最快的机器来作为所有请求的入口，如果这台机器挂掉会使用下一台机器。那这样。。。。肯定是不行的！万一出现双十一这样的情况所有请求集中发送到这一台机器，这台机器很有可能挂掉。一但挂掉了，按照它的机制会转移请求到下台机器，但是这个压力总量还是没有减少啊！下一台还是可能崩溃，所以这个架构还有漏洞！不过这个文章已经太长了，后续解决吧。

参考：
http://docs.mongodb.org/manual/core/sharding-introduction/

原创文章，转载请注明： 转载自LANCEYAN.COM

本文链接地址: 搭建高可用mongodb集群（四）—— 分片

相关文章

mysql并发环境下如何选择隔离级别_mysql配置建议

mysql如何提升读取性能_mysql读性能优化技巧

mysql查询语句执行流程包括哪些_mysql查询执行原理

mysql索引碎片会影响性能吗_mysql索引维护方法

mysql如何插入多条数据_mysql batch insert语法示例

相关标签:

mongodb

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：OCM实验目录下一篇：postgres

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

更多

微信文件过期恢复教程

微信文件过期恢复教程

本专题整合了微信文件过期恢复方法、技巧教程，阅读专题下面的文章了解更多详细内容。

0

2026.02.04

抖音网页版入口与视频观看指南抖音官网视频在线访问

抖音网页版入口与视频观看指南抖音官网视频在线访问

本专题汇总了抖音网页版的入口链接、官方登录页面以及视频观看入口，帮助用户快速访问抖音网页版，提供免登录访问方式和直接进入视频播放页面的方法，确保顺利浏览和观看抖音视频。

63

2026.02.04

学习通网页版入口与在线学习指南学习通官网登录与使用方法

学习通网页版入口与在线学习指南学习通官网登录与使用方法

本专题详细汇总了学习通网页版入口与登录方法，提供学习通官方网页端入口、学生登录平台、网页版使用指南等内容，帮助用户快速稳定地登录学习通官网，顺利进入学习平台，提升学习效率和体验。

9

2026.02.04

Python Web 框架 Django 深度开发

Python Web 框架 Django 深度开发

本专题系统讲解 Python Django 框架的核心功能与进阶开发技巧，包括 Django 项目结构、数据库模型与迁移、视图与模板渲染、表单与认证管理、RESTful API 开发、Django 中间件与缓存优化、部署与性能调优。通过实战案例，帮助学习者掌握使用 Django 快速构建功能全面的 Web 应用与全栈开发能力。

9

2026.02.04

Java 流式处理与 Apache Kafka 实战

Java 流式处理与 Apache Kafka 实战

本专题专注讲解 Java 在流式数据处理与消息队列系统中的应用，系统讲解 Apache Kafka 的基础概念、生产者与消费者模型、Kafka Streams 与 KSQL 流式处理框架、实时数据分析与监控，结合实际业务场景，帮助开发者构建高吞吐量、低延迟的实时数据流管道，实现高效的数据流转与处理。

3

2026.02.04

Golang 容器化与 Docker 实战

Golang 容器化与 Docker 实战

本专题深入讲解 Golang 应用的容器化与 Docker 部署，涵盖 Docker 基础概念、容器构建与镜像管理、Go 应用的 Dockerfile 编写、跨平台容器部署与优化、Docker Compose 和 Kubernetes 部署工具。通过实际案例，帮助学习者掌握如何将 Golang 应用容器化并实现高效部署与管理，提升系统的可扩展性与运维效率。

3

2026.02.04

全国统一发票查询平台入口合集

全国统一发票查询平台入口合集

本专题整合了全国统一发票查询入口地址合集，阅读专题下面的文章了解更多详细入口。

59

2026.02.03

短剧入口地址汇总

短剧入口地址汇总

本专题整合了短剧app推荐平台，阅读专题下面的文章了解更多详细入口。

110

2026.02.03

植物大战僵尸版本入口地址汇总

植物大战僵尸版本入口地址汇总

本专题整合了植物大战僵尸版本入口地址汇总，前往文章中寻找想要的答案。

56

2026.02.03

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

citySHOP 多用户商城

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

Vue 教程

Vue 教程

共42课时 | 7.8万人学习

Django 教程

Django 教程

共28课时 | 3.9万人学习

React 教程

React 教程

共58课时 | 4.6万人学习

最新文章

更多

mysql如何检查权限配置是否正确_mysql权限检查方法

mysql数据库中主键和外键有什么作用_mysql约束说明

mysql中日期与时间函数的基本语法与格式化

mysql表级权限如何配置_mysql表操作权限说明

mysql中分析慢查询日志进行索引优化

mysql事务在高并发场景下怎么优化_mysql性能实践

mysql不同版本mysql权限管理有区别吗_mysql版本差异解析

如何使用where条件筛选数据_mysql条件查询方法

mysql锁等待超时如何优化_mysql并发性能调整

mysql中FULL JOIN的模拟与实现方法

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部