--cluster-replicas必须加且数值需准确,它表示每个主节点配几个从节点;若节点总数不能被(replicas+1)整除,则报错ERR Invalid cluster configuration。

redis-cli --cluster create 命令到底要不要加 --cluster-replicas
必须加,而且数值要算准。不加或填错会导致所有节点都是主节点,没有从节点,集群无法容错。
这个参数表示「每个主节点配几个从节点」,不是「总共几个从节点」。比如 6 个节点、--cluster-replicas 1,就会自动选出 3 个主节点,每个带 1 个从节点;填 2 就会选 2 个主节点,每个带 2 个从节点(共 4 节点被占用),剩下 2 个节点直接报错——不够分。
- 常见错误:
ERR Invalid cluster configuration for replica allocation,基本就是节点总数不能被(replicas + 1)整除 - 6 节点推荐配
--cluster-replicas 1(3 主 3 从),8 节点可配1(4 主 4 从)或3(2 主 6 从),但后者实际意义不大 - 生产环境别用
0:虽然语法合法,但等于放弃高可用,故障即中断
节点 IP 和端口写错会导致 Node is not empty or doesn't contain any cluster information
这个错误不是说数据没清空,而是 redis-cli --cluster create 在发起创建前,会先向每个目标节点发 CLUSTER NODES 查询状态。如果连错了地址(比如连到另一个集群的节点、连到未启动的端口、或连到了本机但 Redis 绑定的是 127.0.0.1 而命令里写了 localhost),就可能读到脏信息或超时失败。
- 务必确认每个节点已启动,且
bind配置允许外部连接(如bind 0.0.0.0或具体内网 IP) - 命令中写的 IP 必须和节点配置里
cluster-announce-ip一致;不设该配置时,Redis 会尝试自动发现,但容易出错,建议显式指定 - 端口别写错:默认是
6379,但集群模式下通常用7000–7005这类端口,写成6379却没关掉原实例,就会连上旧服务
为什么 redis-cli --cluster create 有时卡住不动
大概率是节点之间网络不通,尤其是集群内部通信端口(比服务端口大 10000)没放开。Redis 集群节点间用 port + 10000 做 Gossip 通信,比如服务跑在 7000,就得确保 17000 端口能被其他节点访问。
- Linux 上检查:
ss -tln | grep 17000,确认监听的是0.0.0.0:17000而非127.0.0.1:17000 - Docker 场景更典型:容器内
7000映射到宿主机7000,但17000没映射,也没开容器间网络,结果节点互相 discovery 失败 - 防火墙(
ufw/firewalld)常默认拦掉高位端口,需手动放行
创建后立刻 CLUSTER INFO 显示 cluster_state:fail
说明至少有一个主节点没分配到哈希槽(hash slot),集群认为“不完整”。redis-cli --cluster create 本应自动分配全部 16384 个 slot,但如果中途某个节点响应慢、断连或返回错误,分配就会中断,留下空缺。
- 先查哪个节点没槽:
redis-cli -p 7000 CLUSTER NODES | grep master,看每行开头的 slot 范围是否覆盖全了0-16383 - 手动补槽(谨慎):
redis-cli -p 7000 CLUSTER ADDSLOTS {0..5461},但仅限调试;生产环境应重试创建或检查日志里哪步失败 - 真正省事的做法:加
--cluster-yes参数避免交互确认,再配合足够长的超时(--cluster-timeout 15000)降低因网络抖动导致的中断概率
集群初始化那几步看着简单,但节点间端口、IP 解析、槽分配这三个环节,任何一个卡住都会让整个流程停在“看似成功实则不可用”的状态。动手前最好用 redis-cli -c -p 7000 CLUSTER NODES 连上去扫一眼,比等应用连不上再排查快得多。










