SQL PostgreSQL 的 pgstattuple 的 heap bloat vs index bloat 量化诊断实践

舞夢輝影

发布时间：2026-02-22 13:01:01

354人浏览过

来源于php中文网

原创

pgstattuple扩展需在每个目标数据库单独启用，调用pgstattuple()前须执行create extension pgstattuple；查表膨胀用pgstattuple('table_name')看dead_tuple_count和free_percent，勿误用仅适用于b-tree索引的pgstatindex()。

sql postgresql 的 pgstattuple 的 heap bloat vs index bloat 量化诊断实践

pgstattuple 扩展没启用，`pgstattuple()` 函数直接报错

PostgreSQL 默认不带 pgstattuple，调用 pgstattuple() 或 pgstatindex() 会提示 function does not exist。必须先在目标数据库中启用扩展。

连接到对应数据库后执行：CREATE EXTENSION pgstattuple;
注意不是在 template1 或全局创建，每个需要诊断的库都得单独运行（pg_stat_database 不跨库）
9.6+ 版本支持 pgstattuple_approx()，对大表更快但结果略粗略；真实 bloat 评估建议优先用精确版 pgstattuple()

查 heap bloat 用 `pgstattuple()`，别误用 `pgstatindex()`

pgstatindex() 只返回索引结构信息（比如 B-tree 的层级、页数），完全不反映堆表（heap）的膨胀程度。真正看表本体是否 bloated，必须查 pgstattuple('table_name') 返回的 dead_tuple_count 和 free_percent。

关键字段：重点关注 dead_tuple_count（已 DELETE/UPDATE 但未 VACUUM 的行数）、free_percent（页内空闲空间占比）
典型 bloat 信号：dead_tuple_count > 0 且 free_percent —— 说明有大量死元组堆积，但页内又没足够空闲空间复用，容易触发页分裂和写放大
示例：SELECT * FROM pgstattuple('orders');，别漏掉单引号，表名要加引号（尤其含大小写或特殊字符时）

index bloat 要用 `pgstatindex()` + 手动算，不能只看 `avg_leaf_density`

pgstatindex() 返回的 avg_leaf_density 是叶子页平均填充率，但它不体现“逻辑碎片”——比如一个索引页里存了 100 个键值对，但其中 80 个是 dead tuple，实际有效密度可能极低。真正反映索引 bloat 的是 bt_page_stats() 配合统计。

标小兔AI写标书

一款专业的标书AI代写平台，提供专业AI标书代写服务，安全、稳定、速度快，可满足各类招投标需求，标小兔，写标书，快如兔。

下载

更准的做法：SELECT * FROM bt_page_stats('idx_orders_user_id') WHERE type = 'l'; 查叶子页，看 live_items vs items
简单估算公式：(items - live_items) / items AS bloat_ratio，> 0.3 就值得重索引
注意：pgstatindex() 对非 B-tree 索引（如 GiST、GIN）不适用，会报错或返回空；只有 B-tree 支持完整统计

VACUUM 后 `pgstattuple()` 结果没变？可能是 autovacuum 没扫到或 freeze pending

刚手动跑完 VACUUM orders，再查 pgstattuple('orders') 发现 dead_tuple_count 没降——大概率是事务 ID 冻结（xid wraparound）压力下，autovacuum 被阻塞，或者该表被 long-running transaction 持有 snapshot 锁住，导致死元组无法清理。

检查是否有长事务：SELECT pid, now() - backend_start, state, query FROM pg_stat_activity WHERE state = 'active' AND now() - backend_start > interval '5 minutes';
确认 vacuum 进度：SELECT * FROM pg_stat_progress_vacuum;（9.6+）
如果 free_percent 低但 dead_tuple_count 高，且 vacuum 无进展，优先查 xmin 是否卡在某个老事务上（用 pg_locks 和 pg_transactions 关联）

量化 bloat 不是看单个数字，而是比对 dead_tuple_count、free_percent、live_items 三者的组合关系。最容易忽略的是：heap 和 index 的 bloat 成因不同，修复手段也不同——heap 靠 vacuum，index 靠 reindex，混用只会浪费 I/O。

相关标签:

sql gin select 堆 delete function postgresql 数据库

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：SQL 日期时间函数 DATE_FORMAT、NOW 应用下一篇：暂无

作者最新文章

Linux kubeadm join 的 token / certificate-key 有效期与续期策略

2026-02-19 12:17

GitHub 上的文件如何下载？单个文件与整包下载方法

2026-02-19 12:30

edge浏览器同步密码 Edge密码管理器与加密同步机制解析

2026-02-19 12:43

Python GIL 对多线程性能的影响

2026-02-19 12:52

Python 使用 slots 控制对象内存占用

2026-02-19 13:32

Python Parca 的持续性能剖析

2026-02-19 13:49

GitHub 怎么稳定打开？GitHub 加速访问与网络设置教程

2026-02-19 13:54

Python asyncio.wait 的返回结果分析

2026-02-19 14:16

Linux Harbor 的镜像仓库安全扫描与 RBAC 配置模板

2026-02-19 14:21

拼多多直播怎么上秒拍链接？拼多多秒拍怎么抢

2026-02-19 14:25

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI 编程开发 AI 聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI 编程开发 AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI 编程开发 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 AI 聊天问答

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI 编程开发 AI 文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI 文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

AI 图片处理图片拼接

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI 编程开发 AI 文本写作

智谱清言 - 免费全能的AI助手

AI 编程开发 Agent智能体

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

1006

2023.10.12