先运行 lsmod | grep bonding 检查是否加载,再用 modinfo bonding 确认内核是否编译该模块;未加载则 modprobe bonding 临时启用,或写入 /etc/modules 开机自动加载。

怎么确认内核已启用 bonding 模块
没加载 bonding 模块,配再多次 /etc/sysconfig/network-scripts/ifcfg-bond0 都起不来。先看模块是否存在并已加载:
- 运行
lsmod | grep bonding,无输出说明没加载 - 运行
modinfo bonding,报错Module bonding not found说明内核没编译该模块(极少见,多见于精简版系统) - 临时加载用
modprobe bonding;要开机自动加载,往/etc/modules或/etc/modprobe.d/bonding.conf里写一行bonding
注意:某些发行版(如 CentOS 7+)默认用 NetworkManager 管理网卡,它会绕过 ifup 脚本直接接管接口,导致 bond0 启不起来——得先关掉 NetworkManager 或配置它识别 bonding。
ifcfg-bond0 和从属网卡的配置要点
Red Hat/CentOS 系统下靠 /etc/sysconfig/network-scripts/ 下的 ifcfg- 文件驱动,但顺序和参数稍错就 failover 失效或无法获取 IP:
-
BONDING_OPTS="mode=1 miimon=100 updelay=200 downdelay=200"必须写在ifcfg-bond0里,不能拆到其他文件;mode=1是 active-backup,最常用也最易验证 - 从属网卡(如
ifcfg-ens33)必须设MASTER=bond0和SLAVE=yes,且ONBOOT=yes;不能配IPADDR、NETMASK,否则启动时会冲突 -
DEVICE名必须和文件名一致(ifcfg-bond0→DEVICE=bond0),否则ifup bond0找不到配置 - 改完记得
ifdown bond0 && ifup bond0,别只重启 network 服务——它可能跳过已 up 的接口
常见错误现象:cat /proc/net/bonding/bond0 显示只有 MII Status: down,大概率是某个从属网卡没 up,或 miimon 值设太大(比如 1000),导致链路检测太慢。
怎么验证 failover 真正生效
光看 ip link show bond0 状态为 UP 不代表冗余有效,得模拟物理断连:
- 拔掉主网卡网线(或用
ip link set ens33 down),等 2–3 秒后执行cat /proc/net/bonding/bond0,应看到Currently Active Slave: ens34切换成功 - 检查业务连通性:在另一台机器上持续
ping -I bond0_ip 目标IP,中断时间应 ≤downdelay + miimon(比如 200ms + 100ms = 300ms) - 别依赖
ethtool bond0——它只显示 bond 接口本身状态,不反映底层 slave 切换细节
容易踩的坑:有些交换机默认不转发未学习 MAC 的帧,而 bonding 在切换时会发 gratuitous ARP,若交换机禁用了 arp inspection 或 portfast,会导致短暂丢包甚至通信中断。
systemd-networkd 或 netplan 下怎么配(Ubuntu 18.04+/CentOS 8+)
旧式 ifcfg 文件在较新系统上被忽略,得按当前 init 系统走:
- Ubuntu 20.04+ 用
netplan:在/etc/netplan/01-network-manager-all.yaml里写bonds:块,注意缩进必须是空格(不能 tab),且parameters.mode要小写(如active-backup) - CentOS 8+ 默认用
NetworkManager,得用nmcli创建 bond:nmcli connection add type bond con-name bond0 ifname bond0 mode active-backup,再add-slave加物理口 - 用
systemd-networkd的(如 CoreOS),需配/etc/systemd/network/10-bond0.netdev(定义 bond)和20-bond0.network(配 IP),缺一不可
关键差异:这些新方案不读 /etc/sysconfig/network-scripts/,混用会导致两个管理器抢接口,结果就是 bond0 反复 up/down 或根本获取不到地址。
真正麻烦的不是配置语法,而是不同层面对“link down”的定义不一致:内核看 PHY 信号,bonding 模块看 miimon 探测,交换机看 LACP 报文,应用层看 TCP ACK——四者节奏稍不同,failover 就可能卡在中间状态。调参前最好先抓包看 arp 和 lacpdu 是否正常收发。










