SQL TiDB 的 TiKV compaction 的 level 与 write stall 缓解

舞姬之光

发布时间：2026-02-27 15:17:02

460人浏览过

来源于php中文网

原创

tikv 的 compaction level 不直接触发 write stall，但层级结构（l0–l6）影响 compaction 效率：l0 文件过多或中高层数据膨胀会加剧 compact backlog，进而通过 memtable 超限、l0 文件数超限、pending compaction bytes 过高三类条件引发 write stall；调优应聚焦提前触发 l0 compact、增加后台并发、监控各层文件数与 pending 状态，并协同硬件与部署优化。

sql tidb 的 tikv compaction 的 level 与 write stall 缓解

TiKV 的 compaction level 本身不直接控制 write stall，但 compaction 效率和调度策略会显著影响 write stall 的触发频率和持续时间。关键在于理解 level（层级）在 LSM-tree 中的角色，以及它如何与写入压力、资源瓶颈和 TiKV 的限流机制交互。

Level 结构如何影响 compaction 压力

TiKV 使用 RocksDB 作为底层存储引擎，其默认采用多级 LSM-tree（Level-based Compaction），共 7 级（L0–L6）。L0 层由 MemTable flush 生成，文件无序且允许重叠；L1 及以上每层数据有序、文件不重叠，且大小逐级指数增长（如 L1 ≈ 256MB，L2 ≈ 2GB，L3 ≈ 16GB…）。

这种设计意味着：

HyperWrite

AI写作助手帮助你创作内容更自信

下载

L0 文件过多（如 >4，由 level0_file_num_compaction_trigger 控制）会快速触发 L0→L1 compaction，而 L0 文件读放大高、compact 开销大，容易抢占 I/O 和 CPU 资源
L1–L6 某一层数据量膨胀（如 L3 实际大小远超理论目标），会导致该层 compact backlog 积压，进而阻塞上游 flush 和写入
如果某层 compact 速度持续低于写入速度（例如磁盘吞吐不足或 CPU 不足），整个 compaction pipeline 就会“淤塞”，最终触发 write stall

Write stall 的三类触发条件及其与 level 的关联

TiKV（RocksDB）的 write stall 主要由以下三种 condition 触发，每种都和 level 状态强相关：

MemTable 数量超限：当未 flush 的 MemTable 达到 max_write_buffer_number（默认 5），写入被 stall。这反映 L0 flush 太慢——可能因 L0→L1 compact 慢，导致 L0 文件堆积，反过来又拖慢新 MemTable flush
L0 文件数超限：L0 文件数 ≥ level0_file_num_compaction_trigger（默认 4）时，强制触发 L0 compact；若此时 compact 无法及时完成，系统会 stall 写入等待 compact 进度
Pending compaction bytes 过高：当待 compact 数据量 ≥ soft_pending_compaction_bytes_limit（默认 64GB）时进入 soft stall（限速写入）；≥ hard_pending_compaction_bytes_limit（默认 256GB）则硬 stall（完全阻塞）。这个指标直接受各 level 数据膨胀程度影响

缓解 write stall 的实用调优方向（聚焦 level 相关参数）

不建议盲目调高 level 数或修改 level 目标大小，而应优先保障 compaction 吞吐能力，并让 level 增长更平滑：

调低 level0_file_num_compaction_trigger（如设为 2–3）：让 L0 compact 更早启动，避免 L0 文件爆发式堆积，降低单次 compact 压力
适当增大 max_background_jobs（如从默认 4 提至 8）：提升并发 compact 线程数，尤其利于 L0→L1 和中层 compact 并行处理
启用 universal-compaction（仅限特定场景）：对写密集、key 分布倾斜明显的业务，Universal 可减少 L0 堆积和写放大，但会提高读放大，需实测验证
监控 rocksdb/cur_size_active_mem_table、rocksdb/num-files-at-level、rocksdb/compaction-pending 等指标：确认是否某一层（如 L2 或 L3）长期处于“鼓包”状态，针对性调整该层 size ratio 或增加 level0_slowdown_writes_trigger

硬件与部署协同优化不可忽视

再合理的 level 策略也受限于底层资源：

SSD 必须使用高性能 NVMe，避免 SATA SSD 成为 compaction I/O 瓶颈
TiKV 实例应独占 CPU 核心，避免与其他服务混部导致 compaction 线程被调度饥饿
开启 background_gc（TiKV v6.1+ 默认开启）可异步清理过期 MVCC 版本，间接减少 compact 需处理的数据量
Region 数量过多（如单节点 >10k）会加剧 Raft log 和 KV 引擎间协调开销，放大 compaction 延迟效应，需配合 PD 调度策略控制 Region 均衡

相关标签:

sql 堆线程并发异步 tidb

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL TiDB 的 TiFlash 副本与列存加速查询实践下一篇：暂无

作者最新文章

Python 协程与生成器关系解析

2026-02-26 19:49

Python 多线程与多进程区别面试常见问题

2026-02-26 20:10

Python pytest 常见问题解析

2026-02-26 20:41

苹果手机id一直跳出id验证失败怎么办

2026-02-27 07:57

苹果官网SN码查询入口_苹果官方设备序列号(SN码)查询入口

2026-02-27 08:03

苹果手机照片加水印怎么弄苹果手机照片添加水印方法

2026-02-27 08:07

中国商标注册网查询商标方法_国家知识产权局商标检索系统查询入口指南

2026-02-27 08:38

ppt可以在手机上制作吗_ 手机PPT制作app推荐教程

2026-02-27 08:38

商标注册必须本地吗_商标注册必须本地吗全国统一在线申请指南

2026-02-27 08:44

IQOO电池校准 IQOO电池校准操作方法与技巧

2026-02-27 09:53

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1047

2023.10.12