ESXi 双网卡做 LACP 聚合?完整配置步骤与规范教程

在 ESXi 服务器运维中,为提升网络带宽、实现链路冗余,常会配置双网卡 LACP 链路聚合。该功能无法在标准虚拟交换机上直接实现,必须借助分布式虚拟交换机 DVS 搭配 LAG 组,同时前端物理交换机对应配置 Port Channel 聚合组,软硬件配合才能正常生效。本文从原理、前置准备、交换机配置、ESXi 端分步实操、验证排查等方面详细讲解,兼顾理论与落地,帮助运维人员完成标准 LACP 链路聚合部署。

一、方案原理与前置说明

1.1 核心配置要求

ESXi 环境下搭建 LACP 动态链路聚合,有两大硬性前提,也是本次配置的核心要点:

  1. 虚拟化层面:放弃标准虚拟交换机(vSwitch Standard),使用分布式虚拟交换机 DVS + LAG 聚合组,这是 ESXi 实现 LACP 的唯一官方方案;
  2. 物理网络层面:对接的物理交换机端口必须同步配置 Port Channel(端口聚合),并开启 LACP 协议,软硬件两端模式、参数保持一致。

1.2 为什么不能用标准 vSwitch 做 LACP

ESXi 原生标准虚拟交换机仅支持静态绑定、故障切换等简单负载策略,不兼容标准 LACP 动态协商协议。LACP 需要交换机与主机之间实时交互协议报文、协商链路状态,只有 DVS 分布式交换机具备完整的 LACP 协议栈与 LAG 组管理能力,适合企业集群、多主机统一网络规划场景。

1.3 应用价值

双网卡 LACP 聚合后,可实现带宽叠加链路冗余:单条链路故障时,流量自动切换至另一块网卡,业务不中断;同时两块网卡共同分担流量,解决单网卡带宽瓶颈,广泛用于管理网络、业务虚拟机、vMotion、vSAN 等关键流量场景。

二、配置前准备工作

  1. 硬件确认:ESXi 主机两块同规格物理网卡,接线分别接入同一台物理交换机的不同端口,记录网卡名称(vmnicX)与交换机端口编号;
  2. 环境要求:vCenter 管理整套 ESXi 集群,已提前创建好分布式虚拟交换机 DVS;
  3. 信息记录:记录物理交换机型号、需要聚合的端口号、VLAN 规划、LACP 工作模式;
  4. 业务提醒:建议在业务低峰期、维护窗口操作,避免网络临时中断影响虚拟机运行。

三、第一步:物理交换机配置 Port Channel + LACP

LACP 为双向协商协议,必须先配置物理交换机,再配置 ESXi 端,否则协议协商失败。不同品牌交换机操作逻辑一致,以下为通用配置思路:

  1. 登录物理交换机管理界面,进入需要聚合的两个物理端口;
  2. 将端口模式修改为 Trunk 模式(根据业务需求放行对应 VLAN);
  3. 创建 Port Channel 端口聚合组,将两个选中端口加入该组;
  4. 聚合组协议模式选择 LACP 动态模式(不要使用静态聚合,两端模式必须统一);
  5. 配置负载分担策略,推荐基于源 / 目的 IP、源 / 目的 MAC 分担,适配虚拟化流量特征;
  6. 保存交换机配置,确认 Port Channel 状态为 Up,无端口报错、告警。

补充:若交换机仅支持静态 Port Channel,ESXi 端也需对应改为静态聚合,不建议混合模式。

四、第二步:vCenter 端配置 DVS + LAG 聚合组

整套虚拟化配置在 vCenter 中完成,基于已有的分布式虚拟交换机 DVS 操作,分步流程如下:

4.1 进入 DVS 管理界面

  1. 登录 vCenter Web 客户端,选择左侧【网络】栏目,找到目标分布式虚拟交换机(DVS)
  2. 右键 DVS,选择【管理分布式交换机】-【设置】,进入高级配置页面。

4.2 新建 LAG 链路聚合组

  1. 在配置页面中找到 LAG(链路聚合组) 选项,点击【添加】,新建聚合组;
  2. 自定义 LAG 名称,便于区分业务(如 LAG-Mgmt、LAG-VM);
  3. 聚合模式选择:勾选 LACP(动态链路聚合),与物理交换机 LACP 模式保持一致;
  4. 链路数量选择 2,将主机对应的两块物理网卡(vmnic)添加到当前 LAG 组中;
  5. 负载均衡策略与物理交换机保持统一,完成 LAG 组创建并保存。

4.3 调整 DVS 上行链路

  1. 返回 DVS 主界面,找到【上行链路】配置项;
  2. 将原有独立上行链路,替换为刚刚创建的 LAG 聚合组
  3. 确认上行链路状态正常,无端口冲突、网卡不匹配提示。

4.4 关联端口组(业务落地)

  1. 找到虚拟机端口组、管理网络端口组,编辑端口组属性;
  2. 将端口组的上行链路绑定至新建的 LAG 聚合组;
  3. 核对 VLAN、安全策略、流量限速等配置,保证与原有业务一致。

五、第三步:ESXi 主机侧校验与补充配置

  1. 登录 ESXi 主机 SSH,执行命令查看物理网卡、虚拟交换机状态,确认网卡已加入 DVS 与 LAG 组:

bash

运行

esxcli network nic list
esxcli network vswitch dvs lag list
  1. 检查网卡状态,两块 vmnic 状态均为Up,无断连、错包、丢包;
  2. 查看 LACP 协商状态,确认 ESXi 与物理交换机之间协议报文正常交互,聚合链路成功建立。

六、链路聚合效果验证

6.1 链路冗余测试

  1. 手动拔掉其中一根网线 / 禁用交换机其中一个聚合端口;
  2. 观察虚拟机、主机网络,确认业务无中断、无丢包,流量自动切换至另一块网卡;
  3. 恢复线路后,链路自动重新加入聚合组,负载重新均衡分配。

6.2 带宽与负载测试

使用测速工具测试整体带宽,确认聚合后带宽达到单网卡的叠加效果,两块网卡流量均匀分担,负载策略生效。

6.3 告警检查

查看 vCenter、物理交换机告警面板,确认无 LACP 协商失败、链路异常、端口 Flapping 等报错。

七、常见故障排查与运维误区

7.1 高频故障

  1. LACP 协商失败,链路无法聚合原因:两端协议模式不一致(一端 LACP、一端静态聚合)、VLAN 不匹配、端口 Trunk/Access 模式冲突。解决:统一两端聚合模式,核对端口基础配置。

  2. 单网卡状态 Down,聚合组异常原因:网线故障、光模块损坏、物理端口被禁用。解决:逐段排查物理链路,更换线材或修复交换机端口。

  3. 只能单链路通信,带宽无法叠加原因:两端负载分担策略不一致。解决:ESXi DVS 与物理交换机使用相同的负载均衡算法。

7.2 运维误区避坑

  1. 误区:使用标准 vSwitch 直接配置 LACP。纠正:标准虚拟交换机不支持 LACP 协议,必须使用 DVS+LAG 组合。
  2. 误区:只配置 ESXi,不配置物理交换机 Port Channel。纠正:LACP 是双向协议,物理交换机未配置聚合组,协商必然失败。
  3. 误区:聚合端口跨不同交换机。纠正:普通 LACP 聚合要求所有成员端口在同一台物理交换机,跨交换机需使用堆叠、虚拟化交换机架构。

八、日常运维规范

  1. 定期巡检 LAG 组、Port Channel 状态,关注端口丢包、错包、延迟指标;
  2. 增减物理网卡、修改 VLAN 时,同步修改 ESXi DVS 与物理交换机配置;
  3. 核心业务聚合链路,建议单独划分 LAG 组,与管理网络、存储网络物理隔离;
  4. 升级 ESXi 固件、交换机固件前,提前解除聚合或做好业务迁移,避免协议兼容问题。

九、全文总结

ESXi 实现双网卡 LACP 动态链路聚合,标准配置方案为 DVS 分布式虚拟交换机搭配 LAG 聚合组,同时在对接的物理交换机上配置 Port Channel 端口聚合并开启 LACP。整套配置分为物理交换机、vCenter DVS、ESXi 校验三大环节,两端协议模式、负载策略、端口属性必须完全一致。完成配置后可同时实现链路冗余与带宽扩容,是虚拟化环境中提升网络可靠性的经典方案,运维过程中严格按照规范操作,即可保障聚合链路长期稳定运行。

​注·部分内容为AI辅助生成

posted @ 2026-05-28 09:03  园囧囧园  阅读(37)  评论(0)    收藏  举报