优化UNION查询需确保各子查询使用索引,优先用UNION ALL减少去重开销,并在每个SELECT中通过WHERE和LIMIT尽早过滤数据,避免全表扫描。

在MySQL中优化UNION查询的性能,索引的使用非常关键。UNION操作会合并两个或多个SELECT结果集,并自动去重(UNION ALL不去重),如果每个子查询没有合理利用索引,数据库可能执行全表扫描,导致性能下降。
理解UNION查询的执行机制
MySQL在执行UNION时,会分别运行每个SELECT语句,将结果放入临时表,最后进行去重和排序(仅UNION,UNION ALL不排序)。因此,提升每个子查询的效率是优化的关键。
- 每个SELECT应尽可能通过索引快速定位数据
- 避免在大表上无索引扫描后合并
- 临时表可能使用磁盘存储,影响速度
为每个子查询建立合适的索引
确保每个UNION中的SELECT都能使用索引,尤其是WHERE、JOIN、ORDER BY涉及的列。
- 若查询基于status字段筛选,应在各表的status列上建立索引
- 复合查询条件应考虑组合索引,如 (status, created_at)
- 覆盖索引可避免回表,提升速度
例如:
-- 查询1 SELECT id, name FROM users WHERE status = 1; -- 查询2 SELECT id, name FROM users_archived WHERE status = 1;-- 优化:在 users(status) 和 users_archived(status) 上建立索引 CREATE INDEX idx_status ON users(status); CREATE INDEX idx_status_archive ON users_archived(status);
优先使用 UNION ALL
如果业务允许重复数据,用UNION ALL代替UNION。它不会去重,也不隐式排序,性能更好。
- UNION需要额外的排序和去重步骤,常导致临时表写入磁盘
- UNION ALL直接追加结果,减少开销
示例:
-- 更高效 SELECT id FROM t1 WHERE condition UNION ALL SELECT id FROM t2 WHERE condition;
限制结果集并尽早过滤
在每个子查询中使用LIMIT和精确的WHERE条件,减少参与UNION的数据量。
- 提前过滤无效数据,降低索引扫描范围
- 若最终只需前N条,可在子查询中先LIMIT再合并
例如:
(SELECT id FROM logs_2023 WHERE user_id = 100 LIMIT 10) UNION ALL (SELECT id FROM logs_2024 WHERE user_id = 100 LIMIT 10) LIMIT 10;
基本上就这些。关键是让每个子查询走索引,避免全表扫描,同时根据场景选择UNION或UNION ALL,控制数据量。










