分区键选错会导致全表扫描,需用高频过滤字段;新增分区不迁移旧数据;join时分区键须对齐;ddl和备份需特殊处理。

分区键选错导致查询变慢甚至全表扫描
分区表不是加了就快,核心是让查询能精准落到某个分区。如果 WHERE 条件里没用到分区键,MySQL 或 PostgreSQL 通常会扫描所有分区——性能反而比普通表更差。
常见错误现象:EXPLAIN 显示 partitions: all,或执行时间明显增长;业务查某天数据却触发跨十几个分区扫描。
- 选分区键优先考虑高频过滤字段,比如日志表用
create_time(按天/月分区),订单表用shop_id(按商户分片) - 避免用
UUID、id这类无序主键做 RANGE 分区,会导致数据倾斜和写入热点 - PostgreSQL 的 LIST 分区要求
VALUES IN必须覆盖所有可能值,漏掉会导致INSERT报错:no partition for partitioning key - MySQL 5.7+ 支持
TO_DAYS()函数做日期分区,但注意它不支持NULL值,需提前COALESCE(create_time, '1970-01-01')
新增分区后老数据没自动迁移
分区是逻辑结构,创建新分区不会移动已有数据。很多团队以为“加个 ALTER TABLE ... ADD PARTITION 就能立刻生效”,结果发现新分区空空如也,老数据还在旧分区里躺着。
使用场景:按月分区的表到了下个月,需要把新数据写进新区分,同时保证历史查询不受影响。
- MySQL 中,RANGE/LIST 分区新增分区后,必须手动用
ALTER TABLE ... REORGANIZE PARTITION拆分或合并才能重分布数据(但代价高,慎用) - 更稳妥的做法是提前建好未来 3–6 个月的空分区,用
ALTER TABLE ... DROP PARTITION定期清理过期分区 - PostgreSQL 12+ 支持
ATTACH PARTITION,但只挂载空分区;若要迁移数据,得用INSERT INTO ... SELECT+DELETE配合事务,且注意锁表时间 - 别在高峰期执行
REORGANIZE或大批量INSERT ... SELECT,容易阻塞 DML
JOIN 分区表时关联字段没对齐分区键
两张都分区的表做 JOIN,如果连接字段和各自分区键不一致,优化器无法做分区裁剪,很可能退化成嵌套循环+全分区扫描。
Magento是一套专业开源的PHP电子商务系统。Magento设计得非常灵活,具有模块化架构体系和丰富的功能。易于与第三方应用系统无缝集成。Magento开源网店系统的特点主要分以下几大类,网站管理促销和工具国际化支持SEO搜索引擎优化结账方式运输快递支付方式客户服务用户帐户目录管理目录浏览产品展示分析和报表Magento 1.6 主要包含以下新特性:•持久性购物 - 为不同的
典型例子:订单表按 order_date 分区,用户表按 user_id 分区,两者 JOIN 时用 user_id 关联——订单表完全无法裁剪分区。
- 强关联场景(如订单+订单项),尽量让两张表用相同字段分区,例如都用
order_id % 16做 HASH 分区 - MySQL 8.0+ 支持
PRUNE提示,但仅限单表,对JOIN无效;别依赖/*+ USE_PARTITION(...) */这类伪提示 - 如果必须跨分区键 JOIN,考虑冗余字段:在订单项表里存一份
order_date,并给它建二级分区或索引 - 分区表和非分区表
JOIN一般没问题,优化器会先裁剪分区表,再用结果集驱动另一张表
备份与 DDL 操作卡住或失败
分区表的 ALTER TABLE 不是原子操作,尤其在大表上容易卡住或触发超时。mysqldump 默认导出所有分区,遇到千万级分区可能直接 OOM。
常见错误现象:ALTER TABLE ... DROP PARTITION 执行数小时没反应;mysqldump 报错 Got timeout reading communication packets;pt-online-schema-change 检测到分区表后拒绝操作。
- MySQL 中,
DROP PARTITION是即时的(只删元数据),但TRUNCATE PARTITION会重建分区,实际是删除+重建,IO 压力大 - 备份建议用
mysqldump --skip-triggers --no-create-info --where="create_time >= '2024-01-01'"分批导出,别全量 dump 分区表 - PostgreSQL 的
VACUUM对分区表需单独执行到每个子分区,主表上运行只清理主表元数据 - 不要在从库上直接
ALTER TABLE分区结构,GTID 或 binlog 格式不兼容可能导致复制中断
分区不是银弹,真正难的是让业务查询习惯匹配分区设计——比如强制带时间范围、避免 SELECT *、警惕隐式类型转换让分区键失效。这些细节没对齐,加再多分区也没用。










