如何处理AWR快照生成失败问题_SYSAUX空间不足与MMON进程异常排查

P粉602998670

发布时间：2026-03-16 14:37:33

468人浏览过

来源于php中文网

原创

ORA-1688 错误通常并非 SYSAUX 物理空间耗尽，而是因 MMON 进程异常导致 WRH$ 表快照积压、分区膨胀及自动清理失效；需综合检查 v$bgprocess 中 MMON 状态、WRH$ 段占用、dba_hist_wr_control 保留策略及分区数量。

ORA-1688 错误出现时，`SYSAUX` 表空间真的满了吗？

看到 ora-1688: unable to extend table sys.wrh$ 这类报错，第一反应是 sysaux 满了——但实际常不是“物理空间耗尽”，而是表空间里有大量未清理的旧快照数据，且自动清理被阻塞。oracle awr 默认靠 mmon 进程每小时执行一次清理，但如果它卡住、挂起或被禁用，wrh$* 表就会持续膨胀，哪怕 sysaux 还剩 20% 空间也会报 ora-1688。

检查真实使用率别只看 dba_free_space，要查 dbasegments 中 WRH$ 相关段占了多少：

SELECT segment_name, bytes/1024/1024 MB FROM dba_segments WHERE tablespace_name = 'SYSAUX' AND segment_name LIKE 'WRH$_%' ORDER BY bytes DESC FETCH FIRST 5 ROWS ONLY;

查 dba_hist_wr_control 确认保留策略是否被意外设成极大值（如 10000 天），这会让清理逻辑直接失效
注意：SYSAUX 中 SM/AWR 组件占用超 70% 时，MMON 清理动作大概率已滞后

`MMON` 进程没在跑？先确认它是否真挂了

MMON 是 AWR 快照采集与自动维护的核心后台进程，但它不显示在 v$session 里，也不能用 ps -ef | grep mmon 直接看到 Linux 进程名（它混在 oram000* 类似名称中）。错误判断它“死了”会导致误操作。

查活跃状态最准的方式是：
```
SELECT name, state, recovery_target FROM v$managed_standby WHERE name = 'MMON';
```
——但这个视图其实不反映 MMON；正确做法是查 v$bgprocess：
```
SELECT * FROM v$bgprocess WHERE pname = 'MMON';
```
如果没返回行，或 SPID 为空，说明进程异常退出
常见诱因：数据库刚经历实例崩溃后重启，MMON 可能因内部 latch 冲突卡在初始化阶段，此时 alter system flush shared_pool 无用，必须等它自己恢复或重启实例
不要手动 kill MMON 进程（比如通过 orakill），它没有安全重启机制，强行终止会导致后续快照生成永久失败

手动清理 `WRH$_` 表前，必须绕过 `DBMS_WORKLOAD_REPOSITORY` 的隐式锁

想用 EXEC DBMS_WORKLOAD_REPOSITORY.DROP_SNAPSHOTRANGE(...) 删除旧快照？小心它会在内部对 WRH$ 表加 DML 锁，而如果已有长事务正在写入 AWR（比如另一个 MMON 子进程正往 WRH$_ACTIVE_SESSION_HISTORY 插数据），这个存储过程会无限等待，看起来像“卡住”。

先查有没有阻塞：

SELECT blocking_session, event, sql_id FROM v$session WHERE program LIKE '%MMON%' AND state = 'WAITING';

更稳妥的手动清理方式是分批 truncate（仅限归档模式+已备份的前提下）：
```
ALTER TABLE WRH$_SQLTEXT TRUNCATE PARTITION BEFORE (TO_DATE('2023-01-01','YYYY-MM-DD')) UPDATE GLOBAL INDEXES;
```
——注意必须带 UPDATE GLOBAL INDEXES，否则全局索引失效，AWR 查询直接报错
切勿直接 DROP TABLE 或 DELETE FROM WRH$_：这些表受 Oracle 内部约束保护，硬删会破坏数据字典一致性

快照生成失败后，`WRH$_` 分区增长失控的典型征兆

一旦 AWR 快照连续失败超过 3 小时，WRH$_ 表的分区策略（按时间范围切分）会开始“堆积”：新分区建不出来，老分区又清不掉，结果就是单个表里冒出几百个空分区，每个都占几 MB 数据字典开销，最终拖慢整个 SYSAUX 访问性能。

社研通

文科研究生的学术加速器

下载

查分区数量：

SELECT table_name, COUNT(*) FROM dba_tab_partitions WHERE table_name LIKE 'WRH$_%' GROUP BY table_name ORDER BY 2 DESC;

若 WRH$_ACTIVE_SESSION_HISTORY 超过 200 个分区，基本可判定清理链路已断裂

分区元数据本身不占磁盘空间，但 Oracle 维护它们需要 CPU 和 library cache latch，高并发下会引发 library cache lock 等间接等待
此时即使腾出 10 GB 空间，MMON 也不会自动恢复——必须先用 DBMS_WORKLOAD_REPOSITORY.MODIFY_SNAPSHOT_SETTINGS 临时缩短保留期，逼它触发一次强制清理循环

这事最难的地方不在命令怎么敲，而在你得同时盯住三件事：MMON 进程状态、WRH$_ 分区元数据健康度、以及 SYSAUX 里那些看不见的索引和 LOB 段的实际碎片情况。漏掉任何一项，清理完一小时就复发。

相关标签:

Session 循环堆 delete 并发 table oracle 数据库 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：如何判断游标打开状态_ %ISOPEN属性在游标管理中的应用下一篇：暂无

作者最新文章

Java中的SynchronousQueue有什么特点_容量为0的线程间直接握手传递通道

2026-03-16 09:55

Java基础如何手写一个简单的记事本程序_IO字符流读写与File类文件操作

2026-03-16 09:55

mysql如何备份表结构不包含数据_mysql --no-data参数

2026-03-16 09:56

如何在Golang中控制函数内联Inlining Go语言gcflags参数详解

2026-03-16 09:56

PostgreSQL在Navicat中如何修改已有表结构_高级特性支持

2026-03-16 09:57

怎么设置MongoDB客户端读取操作的过时容忍度_maxStalenessSeconds详解

2026-03-16 09:57

Navicat连Redis出现中文乱码怎么办_字符集编码调整

2026-03-16 09:57

如何配置Active Data Guard_备库实时查询与只读打开模式实现

2026-03-16 09:58

怎么优化远程服务器的开启备份文件加密保护_降低延迟与丢包率

2026-03-16 09:58

如何在Java接口中定义静态方法_工具方法的封装与调用规范

2026-03-16 09:58

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

腾讯元宝

腾讯混元平台推出的AI助手

文档处理 Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI编程开发 AI文本写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

AI文本写作中文写作

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

智谱清言 - 免费全能的AI助手

AI编程开发 Agent智能体

相关专题

session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍：1、会话超时：服务器为Session设置了一个默认的超时时间，当用户在一段时间内没有与服务器交互时，Session将自动失效；2、会话数量限制：服务器为每个用户的Session数量设置了一个限制，当用户创建的Session数量超过这个限制时，最新的会覆盖最早的等等。

336

2023.10.17