keepalived vip漂移异常需按五步排查:一查服务状态与日志;二验vrrp组播通信;三核配置一致性;四确认vip绑定与路由;五调内核参数及selinux。

在Linux环境中部署Keepalived实现虚拟IP高可用时,若主备节点间VIP无法正常漂移或状态异常,通常与配置、网络连通性或VRRP协议交互问题相关。以下是具体实践步骤:
一、检查Keepalived服务状态与日志
确认Keepalived进程是否正常运行,并通过日志定位初始故障点,避免因服务未启动或崩溃导致VIP不生效。
1、执行systemctl status keepalived查看服务当前状态。
2、运行journalctl -u keepalived -n 50 --no-pager获取最近50行日志输出。
3、检查日志中是否存在VRRP_Instance(VI_1) Entering MASTER STATE或BACKUP STATE等状态切换记录。
4、若出现Invalid checksum或Received advert with wrong checksum,说明VRRP报文校验失败,需核查两节点authentication配置是否完全一致。
二、验证VRRP组播通信连通性
VRRP依赖组播地址224.0.0.18进行主备协商,若网络设备禁用组播或防火墙拦截,将导致节点无法感知彼此状态。
1、在主节点执行tcpdump -i eth0 host 224.0.0.18 -nn监听VRRP组播报文。
2、在备节点执行相同命令,观察双方是否能互相捕获对方发送的VRRP Advertisement报文。
3、若仅单向可见,检查交换机是否启用IGMP Snooping或PIM,必要时改用单播模式,在keepalived.conf中将vrrp_sync_group内实例的unicast_src_ip和unicast_peer明确指定对端IP。
4、使用iptables -L INPUT -n | grep 224.0.0.18确认防火墙未丢弃目的地址为224.0.0.18的UDP包(VRRP使用IP协议号112,非UDP端口)。
三、核对Keepalived配置一致性
主备节点的配置差异是VIP漂移失败的最常见原因,包括优先级、抢占模式、认证方式及接口绑定等关键参数必须严格匹配约束条件。
1、比对两节点/etc/keepalived/keepalived.conf中vrrp_instance VI_1块下的state字段:主节点应为MASTER,备节点为BACKUP。
2、确认priority值主节点高于备节点,且差值大于advert_int设定的通告间隔秒数(如advert_int为1,则priority至少相差2)。
3、检查interface是否指向实际承载VIP的物理网卡(如eth0),而非lo或bond接口(除非明确配置支持)。
4、验证authentication块中auth_type(PASS或AH)与auth_pass(前8位有效)在两节点完全相同,auth_pass必须完全一致且长度不超过8字符。
四、确认虚拟IP绑定与路由可达性
即使Keepalived状态正常,若VIP未成功绑定至网卡或下游网络无法学习该IP的MAC映射,业务仍不可达。
1、在MASTER节点执行ip addr show dev eth0 | grep "inet.*virtual",确认VIP以secondary形式出现在接口地址列表中。
2、执行arping -I eth0 -c 3 -S <strong><font color="green">VIP地址</font></strong> <strong><font color="green">网关IP</font></strong>测试ARP响应是否正常。
3、在同网段另一台机器上执行arp -n | grep <strong><font color="green">VIP地址</font></strong>,确认其MAC地址与MASTER节点物理网卡MAC一致。
4、若使用云平台(如阿里云、AWS),需确认平台允许绑定非弹性公网IP的虚拟地址,否则需启用garp_master_refresh并配置notify_master脚本调用云API刷新ARP表。
五、排查内核参数与SELinux干扰
某些Linux发行版默认启用严格内核参数或SELinux策略,可能阻止Keepalived创建原始套接字或绑定组播地址。
1、运行sysctl net.ipv4.ip_nonlocal_bind,确保返回值为1;若为0,执行sysctl -w net.ipv4.ip_nonlocal_bind=1并写入/etc/sysctl.conf持久化。
2、检查net.ipv4.conf.all.send_redirects是否为0,若为1则可能导致VRRP通告被误判为ICMP重定向而丢弃。
3、临时禁用SELinux:setenforce 0,再重启Keepalived观察VIP是否恢复漂移;若恢复正常,需加载keepalived策略模块或设置semanage permissive -a keepalived_t。
4、确认/proc/sys/net/ipv4/conf/eth0/arp_ignore和arp_announce未被设为严格模式(值2或1),否则可能抑制VIP的ARP响应。










