分库分表是随数据量、并发量和业务复杂度增长逐步演进的架构策略,核心目标是解决单库单表的性能与容量瓶颈,同时兼顾开发体验和事务一致性;应优先夯实单库优化,再考虑垂直拆分,最后审慎实施水平分片,并配套完善元数据管理与sql审计等机制。

分库分表不是一上来就拆,而是随着数据量、并发量和业务复杂度增长,逐步演进的架构策略。核心目标是解决单库单表的性能瓶颈(如慢查询、锁竞争、主从延迟)和容量瓶颈(如磁盘空间、连接数、InnoDB 表大小限制),同时尽量不牺牲开发体验与事务一致性。
先判断是否真需要分库分表
很多项目在百万级数据、QPS 几百时就急着分片,反而引入了额外复杂度。建议先做扎实的单库优化:
- 确认慢查询是否可通过索引优化、SQL 重写、读写分离、缓存(Redis)缓解
- 检查是否因大字段、频繁更新、长事务导致锁等待或 binlog 延迟
- 观察 MySQL 的 Threads_connected、Innodb_row_lock_waits、Slow_queries 等关键指标是否持续超标
- 单表行数超过 2000 万(InnoDB)或单库 QPS 超过 3000 且无法通过垂直拆分/缓存压制时,再考虑水平拆分
优先垂直拆分,再考虑水平拆分
垂直拆分是成本最低、见效最快的方案,适合业务边界清晰的系统:
部分功能简介:商品收藏夹功能热门商品最新商品分级价格功能自选风格打印结算页面内部短信箱商品评论增加上一商品,下一商品功能增强商家提示功能友情链接用户在线统计用户来访统计用户来访信息用户积分功能广告设置用户组分类邮件系统后台实现更新用户数据系统图片设置模板管理CSS风格管理申诉内容过滤功能用户注册过滤特征字符IP库管理及来访限制及管理压缩,恢复,备份数据库功能上传文件管理商品类别管理商品添加/修改/
- 按业务域拆库:例如用户中心(user_db)、订单中心(order_db)、商品中心(product_db),各自独立部署、备份和扩缩容
- 按冷热数据拆表:把 user 表中访问频次低的大字段(如个人简介、头像 URL)拆到 user_ext 表,主表保持轻量
- 按读写特征拆表:高频写入的日志类数据(如操作日志、支付流水)单独建库,避免拖慢核心交易链路
水平分片需明确分片键与路由逻辑
一旦进入水平分库分表,分片键(Sharding Key)的选择直接决定后续扩展性与查询效率:
立即学习“PHP免费学习笔记(深入)”;
- 首选高频查询且高基数的字段,如 user_id、order_no、tenant_id;避免用时间字段(如 create_time)——易导致热点和数据倾斜
- 分片算法推荐:取模(mod)+ 动态扩容支持(如一致性哈希、range + mod 混合),避免全量迁移;例如 1024 个逻辑分片,映射到 8 个物理库,每个库 128 张表
- 所有跨分片操作(如 JOIN、GROUP BY、MAX/SUM)必须收敛到应用层处理,或改用 ES/ClickHouse 做聚合分析
- 全局唯一 ID 必须脱离数据库自增:推荐雪花算法(Snowflake)、号段模式(Leaf-segment)或 UUID+时间戳组合
工具与中间件选型要务实
不要为了“技术先进”强行上 ShardingSphere 或 MyCat,尤其对中小团队:
- 初期可用应用层分片:在 DAO 层根据分片键计算库表名(如 order_001、order_002),简单可控,调试直观
- 若已用 Laravel/Lumen,可结合 laravel-sharding 或自定义 DB connection 切换逻辑
- 当分片规则变复杂(多维度路由、影子库压测、读写分离自动降级),再评估 ShardingSphere-JDBC(无代理)或 Proxy 方案
- 务必配套建设分片元数据管理(如分片配置中心)、SQL 审计日志、跨库事务补偿机制(TCC 或本地消息表)









