常见原因
静态LACP模式下Eth-Trunk成员接口无法转发流量的常见原因:
- Eth-Trunk接口被阻塞。
- Eth-Trunk成员接口没有Up。
- Eth-Trunk接口的配置错误。
- Eth-Trunk成员接口不能正常收发LACP报文。
- 底层转发异常。
故障诊断流程
可按照图1排除此类故障。
图1 静态LACP模式下Eth-Trunk成员接口无法转发流量
故障处理步骤
背景信息
执行命令完成故障处理操作后,请根据系统中的配置生效模式,确保配置下发。如无特殊说明,本手册采用配置两阶段生效模式进行描述。
- 配置立即生效模式下,输入命令行并键入回车键后,配置将立即生效。
- 配置两阶段生效模式下,请在完成配置后,执行命令commit,提交配置。
请保存以下步骤的执行结果,以便在故障无法解决时快速收集和反馈信息。
操作步骤
- 查看Eth-Trunk接口的STP状态是否为block。
- 端口状态正常是流量转发的前提。在任意视图下执行display stp brief命令查看Eth-Trunk的STP State字段,确认Eth-Trunk接口是否为block状态。
- <HUAWEI> display stp brief MSTID Port Role STP State Protection Cost Edged 0 10GE1/0/1 ROOT forwarding none 2000 disable 0 Eth-Trunk10 ALTE discarding none 2000 disable 0 10GE1/0/3 DESI forwarding none 2000 disable
- 如果显示为discarding则为block状态,此时数据报文无法转发,请排查网络中的环路。
- 如果Eth-Trunk接口的STP状态不是block状态,请执行步骤2。
- 查看Eth-Trunk成员接口的物理状态是否为Up。
- 成员接口处于UP状态时才能被Eth-Trunk选中。在任意视图下执行display interface interface-type interface-number命令查看Eth-Trunk成员接口的物理状态,其中current state表示接口的物理状态。
- <HUAWEI> display interface 10ge 1/0/1 10GE1/0/1 current state : UP (ifindex: 4) Line protocol current state : UP
- 如果显示为UP则表示接口处于正常启动的状态,请执行步骤3。
- 如果显示不是UP,请检查Eth-Trunk成员接口的物理链路、光模块情况。
- 检查Eth-Trunk接口的配置是否正确。在任意视图下执行display eth-trunk trunk-id命令检查活动接口数上/下限阈值是否合理。其中Max Active-linknumber表示活动接口数上限阈值,Least Active-linknumber表示活动接口数下限阈值。<HUAWEI> display eth-trunk 10 Eth-Trunk10's state information is: Local: LAG ID: 10 Working Mode: Static Preempt Delay Time: 10 Hash Arithmetic: profile default System Priority: 120 System ID: 0025-9e95-7c31 Least Active-linknumber: 1 Max Active-linknumber: 2 Operating Status: up Number Of Up Ports In Trunk: 2 Timeout Period: Slow --------------------------------------------------------------------------------
- 如果配置的活动接口数上限阈值少于期望转发流量的接口,请在Eth-Trunk接口视图下执行lacp max active-linknumber命令修改配置。如果Eth-Trunk接口下Up的成员接口数目少于配置的活动接口数下限阈值,请在Eth-Trunk接口视图下执行least active-linknumber命令修改配置。
- 如果Eth-Trunk接口的配置正确,请执行步骤4。
- 检查Eth-Trunk成员接口是否能够正常收发LACP报文。
- 查看LACP协议报文的收发计数。
- 在用户视图下执行reset lacp statistics eth-trunk trunk-id命令清除原始LACP报文计数。
- 清除LACP的统计信息后,以前的统计信息将无法恢复。
- 在任意视图下执行display lacp statistics eth-trunk trunk-id命令查看LACP报文收发情况。<HUAWEI> display lacp statistics eth-trunk 10 Eth-Trunk10's PDU statistic is: ----------------------------------------------------------------- Port LacpRevPdu LacpSentPdu MarkerRevPdu MarkerSentPdu 10GE1/1/0/10 0 13 0 0 10GE1/1/0/12 13 13 0 0
- 这里查看的是LACP组件的报文处理情况,正常情况下,接收计数LacpRevPdu和发送计数LacpSentPdu都有计数。
- 如果没有发送报文计数,则可能是LACP组件出了问题。
- 如果没有收到报文计数,则需要排查是否收到对端的报文。
- 查看LACP组件是否正常。[~HUAWEI-diagnose] display system component running-state | include LACP ----------------------------------------------------------------------------------------------------------------------- NAME CID PID Type Version Board Process State ----------------------------------------------------------------------------------------------------------------------- LACP 0x80480569 0x4804AC 0x48 2.0.2 1/1 1012 PRIMARY -----------------------------------------------------------------------------------------------------------------------
- 若状态State为NULL则表示LACP组件有问题,请联系技术支持人员处理。
- 查看ACL规则是否存在且正确。
- 在任意视图下执行display cpu-defend statistics命令查看ACL命中计数。
- <HUAWEI> display cpu-defend statistics slot 1 | include lacp Statistics(packets) on slot 1 : -------------------------------------------------------------------------------- PacketType Total Passed Total Dropped Last Dropping Time Last 5 Min Passed Last 5 Min Dropped -------------------------------------------------------------------------------- lacp 0 0 - --------------------------------------------------------------------------------
- 正常情况下,lacp一行中的Total Passed和Last 5 Min Passed列中存在计数,间隔报文发送的一个周期计数会增加。如果不存在计数,或存在计数但不增加,则需进一步排查LACP的ACL规则是否存在。
- 在诊断视图下执行display system tcam service命令获取LACP的ACL规则的EntryID。
- LACP规则为全局下发,每个芯片下发一次。
- 对于CE12800&12800E&16800系列交换机:
- [~HUAWEI-diagnose] display system tcam service cpcar slot 1/1 | include lacp Total: 98 -------------------------------------------- PacketType Entry -------------------------------------------- LACP 26 --------------------------------------------
- 对于CE9800&8800&7800&6800&5800系列交换机:
- [~HUAWEI-diagnose] display system tcam service cpcar slot 1/1 | include lacp Total: 98 ----------------------------------------------------------------- PacketType HitPackets Entry ----------------------------------------------------------------- LACP 2354 26 -----------------------------------------------------------------
- 在诊断视图下执行fediag命令查看ACL规则是否正确。
- [~HUAWEI-diagnose] fediag slot 1 chip 0 "get acl entry info 26" Entry 26 Flags = 00000007 +USED +IN_HW +WANT_HW -upd -chg -new -sta Group = 2 Priority = 2063592367 Prev/Next = 67 / 68 HW entry ID = 0000001B HW priority = 05001450 Qualifiers: DstMac (7) -> da (13) 01:80:C2:00:00:02/FF:FF:FF:FF:FF:FF 00000180C2000002/0000FFFFFFFFFFFF (expected) 00000180C2000002/0000FFFFFFFFFFFF (actual) EtherType (29) -> ethertype (14) 8809/FFFF 0000000000008809/000000000000FFFF (expected) 0000000000008809/000000000000FFFF (actual)
- 上述显示信息中,如果DstMAC是0180c2000002且EtherType是8809,请执行步骤5。如果不是,请执行步骤6。
- 查看底层转发表项是否正确。
- 若LACP协商建立正常,成员口都为select状态,流量仍然不通则需要查看底层转发表项。
- [~HUAWEI-diagnose] display interface Eth-Trunk 10 forwarding-table Eth-Trunk10 The Forwarding Table is NULL.
- 如果转发表为空或者流量不同的接口不在该转发表中,则说明为Eth-Trunk转发表存在问题,请执行步骤6。
- 请收集如下信息,并联系技术支持人员。
- 上述步骤的执行结果。
- 设备的配置文件、日志信息、告警信息。