/dev/shm 被塞满导致 Redis/PostgreSQL 崩溃的业务场景与限制方法

舞夢輝影

发布时间：2026-01-25 17:41:03

175人浏览过

来源于php中文网

原创

/dev/shm 空间耗尽会导致 Redis 和 PostgreSQL 崩溃，因其 RDB 快照、并行查询、WAL 共享内存等依赖该 tmpfs 文件系统；默认 64MB 容易被占满，引发 ENOSPC 错误，造成服务拒绝连接或退出。

/dev/shm 被塞满导致 redis/postgresql 崩溃的业务场景与限制方法

为什么 `/dev/shm` 满了会让 Redis 和 PostgreSQL 崩溃

Redis 默认用 fork() 做 RDB 快照，PostgreSQL 的并行查询、WAL 共享内存、甚至某些客户端连接（如使用 unix_socket_directories 时的 socket 文件）都可能依赖 /dev/shm。它本质是基于 tmpfs 的内存文件系统，默认大小通常只有 64MB（取决于内核版本和发行版），而 fork 时子进程会复制父进程的虚拟内存页（写时复制），但某些共享内存段（如 PostgreSQL 的 shared_memory_type = mmap 或 Redis 的 AOF rewrite 过程中临时缓冲）会直接在 /dev/shm 创建文件——一旦空间耗尽，open() 或 shm_open() 返回 ENOSPC，服务就卡在初始化或 checkpoint 阶段，表现为拒绝新连接、主从同步中断、甚至进程直接退出。

检查 `/dev/shm` 是否真成瓶颈

别只看 df -h /dev/shm，那只是 tmpfs 总大小；更要确认实际被哪些进程占用了：

运行 ls -l /dev/shm/，重点关注以 redis、PostgreSQL、pg_、sem.、shmem. 开头的文件
用 find /dev/shm -type f -size +1M -ls 找大文件
查 Redis 日志是否含 Failed to open the temp file for AOF rewrite 或 Cannot allocate memory
查 PostgreSQL 日志是否含 could not resize shared memory segment 或 out of memory（注意：这不一定是物理内存不足，可能是 shm 限额）

临时扩容与永久配置 `/dev/shm` 大小

临时改法立竿见影但重启失效；永久改法需配合挂载参数，且必须避开 systemd-tmpfiles 的覆盖逻辑：

Miniflow

AI工作流自动化平台

下载

临时扩容（立刻生效）：sudo mount -o remount,size=2G /dev/shm
永久生效（推荐）：编辑 /etc/fstab，把原 tmpfs /dev/shm tmpfs defaults 0 0 改成 tmpfs /dev/shm tmpfs defaults,size=2G 0 0，然后 sudo mount -o remount /dev/shm
避免 systemd 干扰：确保 /usr/lib/tmpfiles.d/tmp.conf 或 /etc/tmpfiles.d/*.conf 中没有对 /dev/shm 的 d 或 Z 类型定义（它们会重置权限和大小）

更治本：让 Redis 和 PostgreSQL 少用 `/dev/shm`

扩容只是兜底，关键要减少对它的依赖：

Redis：设 stop-writes-on-bgsave-error no 只是掩盖问题；真正有效的是关掉 AOF（如果业务允许），或把 appendfilename 改到普通磁盘路径（AOF 文件本身不走 shm，但 rewrite 临时文件会）；升级到 7.0+ 后可用 replica-announce-ip + replica-announce-port 避免某些 shm 通信路径
PostgreSQL：将 shared_memory_type 从默认的 mmap 改为 sysv（需重启），它用 System V IPC 而非 /dev/shm；同时调低 max_connections 和 work_mem，减少共享内存总需求
通用：禁用不需要的扩展（如 pg_stat_statements 在高并发下会频繁写 shm）、定期清理僵尸 socket 文件（find /dev/shm -name "PostgreSQL.*" -mmin +60 -delete）

最常被忽略的是：容器环境里 /dev/shm 默认只有 64MB 且不会继承宿主机配置，docker run --shm-size=2g 或 Kubernetes 的 securityContext.shmSize 必须显式设置。

Linux如何实现任务排队系统_Linux队列与调度器开发

Linux如何实现Reactor网络框架_Linux事件驱动模型讲解

Linux如何开发基于事件驱动的服务_Linux事件回调架构

Linux如何开发事件驱动框架_LinuxReactor模型案例

Linux如何优化C程序内存分配策略_Linuxmalloc内存管理实践

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：大量 sudo: pam_unix session opened 日志刷屏的限流方案下一篇：暂无

作者最新文章

asyncio.Condition 如何实现跨协程的等待与通知

2026-01-24 16:13

SQL 死锁产生的典型场景

2026-01-24 16:23

Linux TIME_WAIT 过多如何处理？

2026-01-24 16:35

如何让类属性变成描述符且支持类型检查

2026-01-24 16:51

getenforce Permissive 但仍被拒绝的 boolean 值误关排查

2026-01-24 16:55

Linux 服务启动顺序如何控制？

2026-01-24 16:58

Linux 孤儿进程由谁接管？

2026-01-24 16:59

numpy 如何用 einsum 实现高效的矩阵运算（爱因斯坦求和）

2026-01-24 17:19

如何让生成器支持 .send() 但保持类型提示正确

2026-01-24 17:22

windows截图快捷是什么？Windows常用截图快捷键组合及使用说明

2026-01-24 17:51

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PC软件

相关专题

scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

188

2023.10.18

500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

291

2023.10.25

数据库Delete用法

数据库Delete用法：1、删除单条记录；2、删除多条记录；3、删除所有记录；4、删除特定条件的记录。更多关于数据库Delete的内容，大家可以访问下面的文章。

274

2023.11.13

drop和delete的区别

drop和delete的区别：1、功能与用途；2、操作对象；3、可逆性；4、空间释放；5、执行速度与效率；6、与其他命令的交互；7、影响的持久性；8、语法和执行；9、触发器与约束；10、事务处理。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

212

2023.12.29

k8s和docker区别

k8s和docker区别有抽象层次不同、管理范围不同、功能不同、应用程序生命周期管理不同、缩放能力不同、高可用性等等区别。本专题为大家提供k8s和docker区别相关的各种文章、以及下载和课程。

257

2023.07.24

docker进入容器的方法有哪些

docker进入容器的方法：1. Docker exec；2. Docker attach；3. Docker run --interactive --tty；4. Docker ps -a；5. 使用 Docker Compose。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

495

2024.04.08

docker容器无法访问外部网络怎么办

docker 容器无法访问外部网络的原因和解决方法：配置 nat 端口映射以将容器端口映射到主机端口。根据主机兼容性选择正确的网络驱动（如 host 或 overlay）。允许容器端口通过主机的防火墙。配置容器的正确 dns 服务器。选择正确的容器网络模式。排除主机网络问题，如防火墙或连接问题。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

401

2024.04.08