0

0

Redis如何分析内存驱逐导致的系统变慢

P粉602998670

P粉602998670

发布时间:2026-03-16 11:39:31

|

261人浏览过

|

来源于php中文网

原创

这是驱逐已开始但尚未爆发的典型信号:Redis达maxmemory后每次写入前检查并触发驱逐,消耗CPU和内存带宽,导致ops下降、延迟升高,evicted_keys持续增长。

redis如何分析内存驱逐导致的系统变慢

为什么 INFO memory 显示内存快满,但 redis-cli --stat 看不到明显写入?

这是驱逐(eviction)已开始但尚未爆发的典型信号。Redis 在达到 maxmemory 后不会立刻卡顿,而是每次写入前检查内存、触发驱逐逻辑——这个过程本身要花时间,尤其当驱逐策略是 allkeys-lruvolatile-lfu 时,需要扫描、排序、淘汰,CPU 和内存带宽都会被占用。

常见错误现象:used_memory_human 接近 maxmemory_humanmem_fragmentation_ratio > 1.5,同时 evicted_keys 持续增长,但 instantaneous_ops_per_sec 却掉到很低,甚至 latency doctor 报出 “eviction is taking too long”。

  • 务必检查 maxmemory-policy:用 CONFIG GET maxmemory-policy 查,noeviction 不会驱逐但直接返回 OOM 错误;allkeys-random 开销最小,volatile-lfu 最耗 CPU
  • evicted_keys 是累计值,要看增量:每秒执行一次 INFO memory,观察它是否稳定上涨(比如每秒 +500)
  • 如果 mem_allocatorjemallocmem_fragmentation_ratio > 2.0,说明内存碎片严重,驱逐时 malloc/free 更慢,此时光调策略没用,得重启或启用 activedefrag yes

怎么定位哪些 key 正在被高频驱逐?

Redis 本身不记录“谁被删了”,但可以通过驱逐行为反推热点 key 的分布特征。真正要查的是“哪些 key 容易被淘汰”,而不是“刚被删了谁”——因为驱逐发生在写入路径上,关键在访问模式和过期设置。

使用场景:业务突然变慢,evicted_keys 暴涨,但监控里没看到大 key 或异常写入流量。

  • 先用 MEMORY USAGE 抽样检查大 key:MEMORY USAGE user:10086,确认是否存在单个 >1MB 的 value(比如未分片的缓存列表)
  • SCAN 配合 TTL 批量看过期时间分布:SCAN 0 MATCH "session:*" COUNT 1000 → 对每个结果跑 TTL,统计 TTL volatile-* 策略就会频繁扫描它们
  • 避免用 KEYS *:它阻塞主线程,在驱逐压力下等于雪上加霜

maxmemory-policy volatile-lru 为什么比 allkeys-lru 更容易卡?

不是算法更复杂,而是数据结构访问模式不同。volatile-lru 要维护两套 LRU 链表:一套是所有带过期时间的 key,另一套是其中“当前未过期”的子集。每次写入都要更新、比较、剪枝,且无法利用 Redis 4.0+ 的近似 LRU 优化(该优化只对 allkeys 生效)。

Machine Translation
Machine Translation

聚合多个来源的AI翻译

下载

性能影响明显:在 100 万 volatile key、平均 TTL 60 秒的实例中,volatile-lru 的驱逐延迟可达 allkeys-lru 的 3–5 倍,且随 key 数量非线性上升。

  • 如果你的业务里 90% 的 key 都设了 EXPIRE,那 volatile-lru 实际等价于 allkeys-lru,还多一层判断——不如直接切 allkeys-lru
  • volatile-ttl 看似简单(只比 TTL),但它会让 Redis 频繁遍历整个过期字典,高并发下锁竞争剧烈,实测比 volatile-lru 更容易引发延迟毛刺
  • 没有“永远安全”的策略:哪怕 noeviction,客户端收到 (error) OOM command not allowed when used memory > 'maxmemory'. 后重试逻辑若没退避,也会打满连接数

如何用 redis-cli --latencyslowlog 分离驱逐干扰?

--latency 测的是纯事件循环延迟,能暴露驱逐导致的主线程卡顿;slowlog 记的是命令执行时间,但驱逐动作不计入 slowlog——所以 slowlog 里看不到慢,系统却卡,正是驱逐在后台吃资源的铁证。

实操建议:

  • 运行 redis-cli --latency -p 6380 看最大延迟(注意单位是毫秒),如果 > 100ms 且与 evicted_keys 上涨时段吻合,基本锁定驱逐问题
  • SLOWLOG GET 5 只能辅助排除:如果 slowlog 里全是正常命令(如 GETHGETALL)且耗时
  • 开启 latency-monitor-threshold 100(单位 ms),再用 LATENCY LATEST 查最近一次超阈值事件类型,输出里出现 eviction 就不用再猜了

真正难处理的,是驱逐和慢命令、大 key、AOF rewrite、RDB save 全部挤在同一时段——这时候 INFO stats 里的 total_commands_processed 增速会断崖下跌,而 instantaneous_input_kbps 却没降,说明网络还在收请求,但 Redis 已经顾不上处理了。

本站声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
counta和count的区别
counta和count的区别

Count函数用于计算指定范围内数字的个数,而CountA函数用于计算指定范围内非空单元格的个数。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

203

2023.11.20

session失效的原因
session失效的原因

session失效的原因有会话超时、会话数量限制、会话完整性检查、服务器重启、浏览器或设备问题等等。详细介绍:1、会话超时:服务器为Session设置了一个默认的超时时间,当用户在一段时间内没有与服务器交互时,Session将自动失效;2、会话数量限制:服务器为每个用户的Session数量设置了一个限制,当用户创建的Session数量超过这个限制时,最新的会覆盖最早的等等。

336

2023.10.17

session失效解决方法
session失效解决方法

session失效通常是由于 session 的生存时间过期或者服务器关闭导致的。其解决办法:1、延长session的生存时间;2、使用持久化存储;3、使用cookie;4、异步更新session;5、使用会话管理中间件。

776

2023.10.18

cookie与session的区别
cookie与session的区别

本专题整合了cookie与session的区别和使用方法等相关内容,阅读专题下面的文章了解更详细的内容。

97

2025.08.19

scripterror怎么解决
scripterror怎么解决

scripterror的解决办法有检查语法、文件路径、检查网络连接、浏览器兼容性、使用try-catch语句、使用开发者工具进行调试、更新浏览器和JavaScript库或寻求专业帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

513

2023.10.18

500error怎么解决
500error怎么解决

500error的解决办法有检查服务器日志、检查代码、检查服务器配置、更新软件版本、重新启动服务、调试代码和寻求帮助等。本专题为大家提供相关的文章、下载、课程内容,供大家免费下载体验。

384

2023.10.25

c++中volatile关键字的作用
c++中volatile关键字的作用

本专题整合了c++中volatile关键字的相关内容,阅读专题下面的文章了解更多详细内容。

77

2025.10.23

treenode的用法
treenode的用法

​在计算机编程领域,TreeNode是一种常见的数据结构,通常用于构建树形结构。在不同的编程语言中,TreeNode可能有不同的实现方式和用法,通常用于表示树的节点信息。更多关于treenode相关问题详情请看本专题下面的文章。php中文网欢迎大家前来学习。

550

2023.12.01

C++多线程并发控制与线程安全设计实践
C++多线程并发控制与线程安全设计实践

本专题围绕 C++ 在高性能系统开发中的并发控制技术展开,系统讲解多线程编程模型与线程安全设计方法。内容包括互斥锁、读写锁、条件变量、原子操作以及线程池实现机制,同时结合实际案例分析并发竞争、死锁避免与性能优化策略。通过实践讲解,帮助开发者掌握构建稳定高效并发系统的关键技术。

2

2026.03.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号