交换机堆叠、链路聚合故障排查

数通

1. 网络拓扑

网络拓扑

2. 报错内容

Port: A -- Auto port, M -- Management port, R -- Reference port
Flags:  A -- LACP_Activity, B -- LACP_Timeout, C -- Aggregation,
        D -- Synchronization, E -- Collecting, F -- Distributing,
        G -- Defaulted, H -- Expired

Aggregate Interface: Bridge-Aggregation200
Creation Mode: Manual
Aggregation Mode: Dynamic
Loadsharing Type: Shar
Management VLANs: None
System ID: 0x8000, 4073-4d20-3da0
Local:
Port         Status Priority Index Oper-Key Flag
XGE1/0/22(R) S      32768    1     1       {ACDEF}
XGE2/0/22    U      32768    3     1       {ACG}
XGE3/0/22    S      32768    4     1       {ACDEF}
XGE4/0/22    U      32768    2     1       {ACG}
Remote:
Actor        Priority Index Oper-Key SystemID              Flag
XGE1/0/22    32768    130   54      0x8000,487a-da57-e600 {ACDEF}
XGE2/0/22    32768    0     0       0x8000,0000-0000-0000 {DEF}
XGE3/0/22    32768    132   54      0x8000,487a-da57-e600 {ACDEF}
XGE4/0/22    32768    0     0       0x8000,0000-0000-0000 {DEF}
[H3C]

完成堆叠和链路聚合配置后,有两个端口处于未选中状态。

3. 交换机配置

核心交换机配置:

<CoreSwitch-S7506E>dis cu int Bridge-Aggregation 60
#
interface Bridge-Aggregation60
 description C5_wanZhao-Switch3_192.168.100.25
 port link-type trunk
 undo port trunk permit vlan 1
 port trunk permit vlan 4 96 to 97 99 101 103 110 to 111 140 200 241 1006
 link-aggregation mode dynamic
#
return

万兆交换机配置:

%Jan  1 00:48:48:433 2021 H3C STP/6/STP_NOTIFIED_TC: Instance 0's port Bridge-Ag

[H3C-Bridge-Aggregation200]
[H3C-Bridge-Aggregation200]
[H3C-Bridge-Aggregation200]dis this
#
interface Bridge-Aggregation200
 port link-type trunk
 undo port trunk permit vlan 1
 port trunk permit vlan 4 96 to 97 99 101 103 110 to 111 140 200 241 1006
 link-aggregation mode dynamic
#
return
[H3C-Bridge-Aggregation200]

4. 故障分析

故障分析

上图是 H3C 交换机执行 display link-aggregation verbose 的输出结果,下面逐项拆解解读。

(1)聚合组基础全局信息

字段 含义解读
Aggregate Interface: Bridge-Aggregation200 二层链路聚合组 BAGG200,用于二层数据转发
Creation Mode: Manual 手工创建的聚合组
Aggregation Mode: Dynamic 运行动态 LACP 协商模式,依靠 LACP 协议自动维护链路成员状态
Loadsharing Type: Shar 负载分担模式,聚合组流量按哈希算法分担到不同成员端口
System ID: 0x8000, 4073-4d20-3da0 本端设备的 LACP 系统优先级 + MAC 地址

(2)端口与状态标识定义

Port: A -- Auto port, M -- Management port, R -- Reference port

  • A:自动成员端口
  • R:聚合组基准参考端口

Flags 标志位详解(最关键运行状态)

  • A:LACP 主动发送协商报文
  • B:LACP 超时时间(短超时/长超时)
  • C:端口可参与链路聚合
  • D:本端端口状态已和对端同步
  • E:已开始接收入方向流量
  • F:已开始向外发送流量
  • G:默认状态(收不到对端 LACP 报文时)
  • H:LACP 协商超时、链路老化

(3)本端端口(Local)状态

  • S = Selected:端口正常加入聚合,可转发数据
  • U = Unselected:端口被剔除,不承载业务
  • I = Individual:端口独立,未加入聚合

(4)远端(Remote)对端信息

展示对端设备的系统优先级、端口优先级、Oper-Key、系统 ID 与 Flag 状态,用于校验 LACP 两端匹配情况。

5. 故障排查

当前问题

  • XGE2/0/22 端口标记 {ACG},缺少 D(同步)、E(收)、F(发),LACP 协商未完全打通
  • XGE4/0/22 直接处于未选中状态,无法上线

排查方向

  • 检查对端对应端口的 LACP 模式、聚合组配置是否完全一致
  • 检查端口 VLAN、允许通过的 VLAN、PVID、端口速率/双工模式是否匹配
  • 物理层排查:光模块、光纤、链路连通性是否正常
  • 确认两端 LACP 超时、主动/被动模式配置是否对齐

正常端口状态(XGE1/0/22、XGE3/0/22)

Flag = {ACDEF}

→ 完整 5 项标记:协商激活、聚合合格、状态同步、接收流量、发送流量,完全就绪

异常端口状态(XGE2/0/22、XGE4/0/22)

Flag = {ACG}

→ 只有基础协商和默认初始状态,缺少 D(同步)、E(收)、F(发)

→ LACP 握手未完成,两端状态无法达成一致,被标记为未选中

根因与解决

检查核心交换机配置,链路聚合参数无误。检查物理链路时发现:核心交换机的接口插错了位置。两台交换机原本应使用 6、7 号口互联,实际却插到了 7、8 号口。调整接口连线后,问题解决,故障排除。

核心交换机确认状态