缓存雪崩是大量缓存集体失效导致数据库瞬间过载;PHP中表现为Redis::get大量返回null后mysqli_query/PDO::query出现连接超时、CPU飙升、慢日志暴增,常见于定时刷新或同TTL设置场景。

缓存雪崩是什么,PHP里怎么一眼识别
缓存雪崩不是慢,是集体失效后数据库被瞬间打穿。在 PHP 中典型表现是:Redis::get() 大量返回 null,紧接着 mysqli_query() 或 PDO::query() 出现连接超时、CPU 突升、慢日志暴增。尤其发生在定时任务刷新缓存后、或大量 key 设置了相同过期时间(比如都设 3600 秒)的场景。
给缓存加随机过期时间(最简单有效的防线)
别让所有 key 在同一秒过期。PHP 中设置缓存时,在基础 TTL 上叠加一个随机偏移量:
```php $baseTtl = 3600; // 1小时 $randomOffset = rand(0, 600); // ±10分钟 $ttl = $baseTtl + $randomOffset;$redis->setex($key, $ttl, $value);
- 偏移量建议控制在基础 TTL 的 10%–20%,太小没用,太大影响一致性
- 不要用
time() + $ttl算过期时间再存——setex/set的EX参数才是原子性保障 - 如果用
apcu_store(),也得手动加随机:apcu_store($key, $value, $ttl + rand(0, 300))
用互斥锁(mutex)挡住并发回源请求
当缓存失效时,多个 PHP-FPM 进程同时发现没数据,都会去查 DB——这就是“击穿+雪崩”的温床。必须只放行一个进程重建缓存:
立即学习“PHP免费学习笔记(深入)”;
```php
$key = 'user:123:profile';
$lockKey = $key . ':lock';
$lockExpire = 30; // 锁最多 hold 30 秒,防死锁
// 尝试加锁
if ($redis->set($lockKey, 1, ['NX', 'EX' => $lockExpire])) {
try {
$data = $pdo->query("SELECT * FROM users WHERE id = 123")->fetch();
$redis->setex($key, 3600 + rand(0, 600), json_encode($data));
} finally {
$redis->del($lockKey); // 必须释放
}
} else {
// 等待 100ms 后重试(或直接 sleep(0.1)),避免忙等
usleep(100000);
$value = $redis->get($key); // 再捞一次,可能已被别的进程写入
}
```
-
NX是关键:只有 key 不存在才设成功,保证锁唯一性 - 锁过期时间必须短于业务查询最大耗时,否则会误删别人持有的锁
- 别用
file_put_contents(..., LOCK_EX)做锁——跨机器不生效,且性能差
兜底:本地缓存 + 熔断降级(PHP 层最后一道闸)
Redis 挂了或网络抖动时,不能全量回源。PHP 应保留一层轻量本地缓存(如 APCu)并配合简单熔断逻辑:
```php
function getCachedUser($id) {
$key = "user:{$id}";
// 先查 APCu(本地,无网络开销)
if (($local = apcu_fetch($key)) !== false) {
return $local;
}
// 再查 Redis
$redisValue = $redis->get($key);
if ($redisValue !== false) {
apcu_store($key, $redisValue, 60); // 本地缓存 60 秒,减轻 Redis 压力
return $redisValue;
}
// 缓存未命中 → 触发熔断检查
if (isCircuitBreakerOpen('user_db')) {
return ['name' => '用户信息暂不可用', 'offline_fallback' => true];
}
// 查库 + 写两级缓存
$row = $pdo->query("...")->fetch();
$redis->setex($key, 3600 + rand(0, 600), json_encode($row));
apcu_store($key, json_encode($row), 60);
return $row;
}
```
- APCu 不是万能的,它只在单 FPM 进程内有效,所以不能替代分布式缓存,但能显著缓解 Redis 故障时的冲击
- 熔断器状态建议存在 Redis 里(带过期),由所有进程共享;简单实现可用
redis->incr($breakerKey)+ 计数窗口 - fallback 数据结构要和正常数据保持兼容,否则调用方容易报错











