天天看点

静态LACP模式下Eth-Trunk成员接口无法转发流量的故障定位思路

常见原因

静态LACP模式下Eth-Trunk成员接口无法转发流量的常见原因:

  • Eth-Trunk接口被阻塞。
  • Eth-Trunk成员接口没有Up。
  • Eth-Trunk接口的配置错误。
  • Eth-Trunk成员接口不能正常收发LACP报文。
  • 底层转发异常。

故障诊断流程

可按照图1排除此类故障。

图1 静态LACP模式下Eth-Trunk成员接口无法转发流量

静态LACP模式下Eth-Trunk成员接口无法转发流量的故障定位思路

故障处理步骤

背景信息

静态LACP模式下Eth-Trunk成员接口无法转发流量的故障定位思路

执行命令完成故障处理操作后,请根据系统中的配置生效模式,确保配置下发。如无特殊说明,本手册采用配置两阶段生效模式进行描述。

  • 配置立即生效模式下,输入命令行并键入回车键后,配置将立即生效。
  • 配置两阶段生效模式下,请在完成配置后,执行命令commit,提交配置。

请保存以下步骤的执行结果,以便在故障无法解决时快速收集和反馈信息。

操作步骤

  1. 查看Eth-Trunk接口的STP状态是否为block。
  2. 端口状态正常是流量转发的前提。在任意视图下执行display stp brief命令查看Eth-Trunk的STP State字段,确认Eth-Trunk接口是否为block状态。
  3. <HUAWEI> display stp brief MSTID Port Role STP State Protection Cost Edged 0 10GE1/0/1 ROOT forwarding none 2000 disable 0 Eth-Trunk10 ALTE discarding none 2000 disable 0 10GE1/0/3 DESI forwarding none 2000 disable
  4. 如果显示为discarding则为block状态,此时数据报文无法转发,请排查网络中的环路。
  5. 如果Eth-Trunk接口的STP状态不是block状态,请执行步骤2。
  6. 查看Eth-Trunk成员接口的物理状态是否为Up。
  7. 成员接口处于UP状态时才能被Eth-Trunk选中。在任意视图下执行display interface interface-type interface-number命令查看Eth-Trunk成员接口的物理状态,其中current state表示接口的物理状态。
  8. <HUAWEI> display interface 10ge 1/0/1 10GE1/0/1 current state : UP (ifindex: 4) Line protocol current state : UP
  9. 如果显示为UP则表示接口处于正常启动的状态,请执行步骤3。
  10. 如果显示不是UP,请检查Eth-Trunk成员接口的物理链路、光模块情况。
  11. 检查Eth-Trunk接口的配置是否正确。在任意视图下执行display eth-trunk trunk-id命令检查活动接口数上/下限阈值是否合理。其中Max Active-linknumber表示活动接口数上限阈值,Least Active-linknumber表示活动接口数下限阈值。<HUAWEI> display eth-trunk 10 Eth-Trunk10's state information is: Local: LAG ID: 10 Working Mode: Static Preempt Delay Time: 10 Hash Arithmetic: profile default System Priority: 120 System ID: 0025-9e95-7c31 Least Active-linknumber: 1 Max Active-linknumber: 2 Operating Status: up Number Of Up Ports In Trunk: 2 Timeout Period: Slow --------------------------------------------------------------------------------
  12. 如果配置的活动接口数上限阈值少于期望转发流量的接口,请在Eth-Trunk接口视图下执行lacp max active-linknumber命令修改配置。如果Eth-Trunk接口下Up的成员接口数目少于配置的活动接口数下限阈值,请在Eth-Trunk接口视图下执行least active-linknumber命令修改配置。
  13. 如果Eth-Trunk接口的配置正确,请执行步骤4。
  14. 检查Eth-Trunk成员接口是否能够正常收发LACP报文。
    1. 查看LACP协议报文的收发计数。
      1. 在用户视图下执行reset lacp statistics eth-trunk trunk-id命令清除原始LACP报文计数。
      2. 清除LACP的统计信息后,以前的统计信息将无法恢复。
      3. 在任意视图下执行display lacp statistics eth-trunk trunk-id命令查看LACP报文收发情况。<HUAWEI> display lacp statistics eth-trunk 10 Eth-Trunk10's PDU statistic is: ----------------------------------------------------------------- Port LacpRevPdu LacpSentPdu MarkerRevPdu MarkerSentPdu 10GE1/1/0/10 0 13 0 0 10GE1/1/0/12 13 13 0 0
      4. 这里查看的是LACP组件的报文处理情况,正常情况下,接收计数LacpRevPdu和发送计数LacpSentPdu都有计数。
      5. 如果没有发送报文计数,则可能是LACP组件出了问题。
      6. 如果没有收到报文计数,则需要排查是否收到对端的报文。
    2. 查看LACP组件是否正常。[~HUAWEI-diagnose] display system component running-state | include LACP ----------------------------------------------------------------------------------------------------------------------- NAME CID PID Type Version Board Process State ----------------------------------------------------------------------------------------------------------------------- LACP 0x80480569 0x4804AC 0x48 2.0.2 1/1 1012 PRIMARY -----------------------------------------------------------------------------------------------------------------------
    3. 若状态State为NULL则表示LACP组件有问题,请联系技术支持人员处理。
    4. 查看ACL规则是否存在且正确。
      1. 在任意视图下执行display cpu-defend statistics命令查看ACL命中计数。
      2. <HUAWEI> display cpu-defend statistics slot 1 | include lacp Statistics(packets) on slot 1 : -------------------------------------------------------------------------------- PacketType Total Passed Total Dropped Last Dropping Time Last 5 Min Passed Last 5 Min Dropped -------------------------------------------------------------------------------- lacp 0 0 - --------------------------------------------------------------------------------
      3. 正常情况下,lacp一行中的Total Passed和Last 5 Min Passed列中存在计数,间隔报文发送的一个周期计数会增加。如果不存在计数,或存在计数但不增加,则需进一步排查LACP的ACL规则是否存在。
      4. 在诊断视图下执行display system tcam service命令获取LACP的ACL规则的EntryID。
      5. LACP规则为全局下发,每个芯片下发一次。
      6. 对于CE12800&12800E&16800系列交换机:
      7. [~HUAWEI-diagnose] display system tcam service cpcar slot 1/1 | include lacp Total: 98 -------------------------------------------- PacketType Entry -------------------------------------------- LACP 26 --------------------------------------------
      8. 对于CE9800&8800&7800&6800&5800系列交换机:
      9. [~HUAWEI-diagnose] display system tcam service cpcar slot 1/1 | include lacp Total: 98 ----------------------------------------------------------------- PacketType HitPackets Entry ----------------------------------------------------------------- LACP 2354 26 -----------------------------------------------------------------
      10. 在诊断视图下执行fediag命令查看ACL规则是否正确。
      11. [~HUAWEI-diagnose] fediag slot 1 chip 0 "get acl entry info 26" Entry 26 Flags = 00000007 +USED +IN_HW +WANT_HW -upd -chg -new -sta Group = 2 Priority = 2063592367 Prev/Next = 67 / 68 HW entry ID = 0000001B HW priority = 05001450 Qualifiers: DstMac (7) -> da (13) 01:80:C2:00:00:02/FF:FF:FF:FF:FF:FF 00000180C2000002/0000FFFFFFFFFFFF (expected) 00000180C2000002/0000FFFFFFFFFFFF (actual) EtherType (29) -> ethertype (14) 8809/FFFF 0000000000008809/000000000000FFFF (expected) 0000000000008809/000000000000FFFF (actual)
      12. 上述显示信息中,如果DstMAC是0180c2000002且EtherType是8809,请执行步骤5。如果不是,请执行步骤6。
  15. 查看底层转发表项是否正确。
  16. 若LACP协商建立正常,成员口都为select状态,流量仍然不通则需要查看底层转发表项。
  17. [~HUAWEI-diagnose] display interface Eth-Trunk 10 forwarding-table Eth-Trunk10 The Forwarding Table is NULL.
  18. 如果转发表为空或者流量不同的接口不在该转发表中,则说明为Eth-Trunk转发表存在问题,请执行步骤6。
  19. 请收集如下信息,并联系技术支持人员。
  20. 上述步骤的执行结果。
  21. 设备的配置文件、日志信息、告警信息。

继续阅读