SQL如何处理数据倾斜引发的性能骤降_直方图收集与查询条件分散

P粉602998670

发布时间：2026-03-19 12:34:03

838人浏览过

来源于php中文网

原创

ANALYZE TABLE后查询仍慢因直方图未被优化器采用——仅当WHERE列无索引时启用；有索引则优先用索引统计，需用USE_HISTOGRAM提示强制触发，且低基数列效果差。

sql如何处理数据倾斜引发的性能骤降_直方图收集与查询条件分散

为什么 `ANALYZE TABLE` 后查询还是慢？直方图没生效

直方图不是收集完就自动起作用的——MySQL 8.0+ 默认只对 WHERE 条件中出现的列、且该列上没有索引时，才考虑用直方图估算行数。如果列上有索引，优化器大概率直接走索引统计信息，忽略直方图。

常见错误现象：EXPLAIN 显示 rows 估算严重偏高（比如实际 100 行，预估 50 万），但 SHOW CREATE TABLE 确认直方图已存在。

检查是否真被用上：执行 SELECT * FROM information_schema.COLUMN_STATISTICS WHERE TABLE_NAME = 'your_table' AND COLUMN_NAME = 'your_col';，确认 HISTOGRAM 字段非空且类型合理（如 SINGLE_PRECISION 或 DOUBLE_PRECISION）
强制触发直方图参与估算：在查询中加 /*+ USE_HISTOGRAM(your_col) */ 提示（MySQL 8.0.26+），验证是否改善
避免“伪热点”：直方图对低基数列（如状态字段只有 'pending'/'done'）效果差，此时应优先建索引而非依赖直方图

`WHERE` 条件写成 `IN` 还是 `=` 更利于打散倾斜？

数据倾斜常出现在某几个值占了 90%+ 的记录，比如用户表里 tenant_id = 1 占 85%。这时单条 = 查询必然压到同一组分区或同一块数据页，而 IN 并不天然分散——如果 IN (1, 1, 1)，照样全打在 tenant_id=1 上。

真正起作用的是「条件值分布」，不是语法形式。

用 IN 前先查分布：SELECT tenant_id, COUNT(*) FROM users GROUP BY tenant_id ORDER BY COUNT(*) DESC LIMIT 5;，挑出高频值之外的几个低频值组合测试
慎用 IN 大列表：MySQL 对 IN 列表长度超过 1000 项时可能退化为全表扫描，反而更慢
业务层可主动拆分：把一个查 10 万行的 tenant_id = 1，改成 10 个并发查 tenant_id = 1 AND user_id BETWEEN ? AND ?，配合主键范围切分

分区表 + 直方图能缓解倾斜吗？

不能。MySQL 的分区是存储层面的物理切分，但查询计划仍由优化器统一生成。如果所有查询都命中同一个分区（比如按 tenant_id 分区，而查询总是 tenant_id = 1），那直方图再准也没用——瓶颈在单一分区的 I/O 和锁竞争。

Boba.video

AI动漫视频生成器

下载

分区本身不解决倾斜，还可能让问题更隐蔽：比如 EXPLAIN PARTITIONS 显示只扫一个分区，但这个分区太大，内部仍有严重倾斜。

分区键必须和查询条件强相关：若常查 created_at，就别用 tenant_id 分区
直方图需在每个分区单独收集（MySQL 不支持跨分区直方图），执行 ANALYZE TABLE t PARTITION(p1);
更现实的替代：用 SHARDING（应用层分库）或物化视图预聚合高频值，而不是依赖分区+直方图组合

为什么 `OPTIMIZER_USE_SQL_PLAN_BASELINES` 开启后倾斜更严重？

SQL Plan Baseline 锁定了执行计划，包括访问路径、连接顺序、是否使用索引等。当数据分布变化（比如新租户涌入导致原“低频值”变高频），旧基线仍强行复用老计划，结果就是本该走索引的现在全表扫，本该用直方图估算的现在硬套旧统计值。

典型表现：某天凌晨批量导入后，原本 200ms 的查询突然飙到 12s，EXPLAIN 显示从 range 变成 ALL，且 key 列为空。

检查基线是否过期：SELECT SQL_HANDLE, PLAN_NAME, ORIGIN, ENABLED, ACCEPTED FROM mysql.slow_log_plan;，重点关注 ACCEPTED = 'NO' 的计划
临时绕过基线：加 /*+ NO_PLAN_BASELINE */ 提示，看是否恢复
不要长期开启 OPTIMIZER_CAPTURE_SQL_PLAN_BASELINES：它会无差别捕获所有慢查询，包括那些本就因倾斜而慢的语句，把坏计划也固化了

直方图和基线本质冲突：一个靠动态统计适应数据变化，一个靠静态计划拒绝变化。生产环境若用基线，就得接受定期人工校验+更新，不能指望它自动适配倾斜演变。

数码产品性能查询

该软件包括了市面上所有手机CPU，手机跑分情况，电脑CPU，电脑产品信息等等，方便需要大家查阅数码产品最新情况，了解产品特性，能够进行对比选择最具性价比的商品。

下载

相关标签:

大数据 sql mysql sqlite oracle hive postgresql sqlserver 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL执行DELETE删除速度极慢_为WHERE筛选列创建索引优化下一篇：SQL关联查询中如何排除特定条件记录_JOIN配合NOT EXISTS分析

作者最新文章

mysql如何通过权限实现数据分片存储_MySQL分片用户管理

2026-03-19 11:09

如何防止用户直接修改字典_O7_DICTIONARY_ACCESSIBILITY参数

2026-03-19 11:10

怎样在Java中搭建MongoDB开发环境_Java非关系型数据库

2026-03-19 11:11

如何优雅地停用SQL触发器_使用存储过程批量管理触发状态

2026-03-19 11:11

如何优化SQL海量数据JOIN查询_执行计划分析与连接顺序调整

2026-03-19 11:11

如何安装Oracle Instant Client_轻量级客户端免安装配置

2026-03-19 11:12

SQL实现基于用户权限的JOIN查询限制_安全视图与连接过滤

2026-03-19 11:12

Redis如何开启声明式缓存功能

2026-03-19 11:12

Python怎么降级版本_退回旧版本Python解释器实操指南

2026-03-19 11:14

火狐浏览器自建同步服务器怎么配_火狐浏览器数据隐私本地化教程

2026-03-19 11:14

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

大数据分析工具有哪四个

大数据分析的四个工具分别是rapidminer、Hpcc、Hadoop和Pentaho bi。大数据分析用于从各种来源生成的原始数据中提取有价值的数据。这些数据帮助我们获得有意义的见解、隐藏的模式、未知的相关性、市场趋势等等，具体取决于行业。大数据分析的主要动机是提供有价值的见解，以便为未来做出更好的决策。php中文网为大家带来了大数据分析的相关教程、以及相关文章等内容，供大家免费下载使用。

166

2023.06.21

Java 大数据处理基础（Hadoop 方向）

本专题聚焦 Java 在大数据离线处理场景中的核心应用，系统讲解 Hadoop 生态的基本原理、HDFS 文件系统操作、MapReduce 编程模型、作业优化策略以及常见数据处理流程。通过实际示例（如日志分析、批处理任务），帮助学习者掌握使用 Java 构建高效大数据处理程序的完整方法。

786

2025.12.08

大数据专业学习教程

本专题整合了大数据专业学习相关教程，阅读专题下面的文章了解更多详细内容。

2026.01.05

python处理大数据合集

本专题整合了python处理大数据相关教程，阅读专题下面的文章了解更多详细内容。

112

2026.01.05

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1135

2023.10.12