天天看點

雲雜談:專線故障排查案例分享,理順思路

今天就來聊一聊小編在雲服務過程中遇到專線相關問題,有簡單的兩個案例分享,通過案例來說說平時的排障思路,希望能幫助到大家!

案例1:因mac位址問題導緻專線通道不通

客戶故障背景:

客戶IDC和騰訊雲是通過兩條專線靜态路由接入進行主備互聯,因為合作商線路故障,業務切換到備線;

客戶在業務側修改了路由表資訊,将下一條路由指向了備線。

ip route-static 10.70.0.0 255.255.0.0 172.18.68.5

雲雜談:專線故障排查案例分享,理順思路

客戶專線互聯拓撲

主線恢複後,重新修改到vpc的路由

ip route-static 10.70.0.0 255.255.0.0 172.18.68.5

改成ip route-static 10.70.0.0 255.255.0.0 172.18.67.1

發現到騰訊雲的業務就不通了。

排障思路:

1、從騰訊雲側ping客戶互聯ip,發現不通。mtr發現還沒有到專線互聯位址。

雲雜談:專線故障排查案例分享,理順思路

ping客戶對端不通

雲雜談:專線故障排查案例分享,理順思路

騰訊雲到客戶側mtr

2、客戶回報在接入交換機上ping通騰訊雲端互聯位址。mtr發現還沒有到專線互聯位址。

雲雜談:專線故障排查案例分享,理順思路

ping騰訊雲端通

雲雜談:專線故障排查案例分享,理順思路

客戶側到騰訊雲mtr

按理說,客戶能ping通互聯位址,mtr應該是可以到互聯位址,但是這裡并沒有,這裡有很大的疑問???

3、再次确認兩端的實體端口都是up狀态

4、确認騰訊雲側能收到客戶業務網段路由,但是為啥ping不通對端互聯位址?

雲雜談:專線故障排查案例分享,理順思路

5、确認客戶側的mac表項,發現明顯對不上!

客戶側:

IP ADDRESS MAC ADDRESS EXPIRE(M) TYPE INTERFACE VPN-INSTANCE

VLAN/CEVLAN

------------------------------------------------------------------------------

172.18.67.2 e4c2-d1fe-66e7 I - Vlanif1341

172.18.67.1 e4a8-b63b-aefd 17 D-0 GE4/0/4

------------------------------------------------------------------------------

騰訊雲側:

雲雜談:專線故障排查案例分享,理順思路

騰訊雲端口mac

原因分析:

客戶側沒有正确學習到騰訊雲側的mac位址。是什麼原因導緻沒有正确學習呢?中間合作商回報是能夠正确學習到騰訊雲mac位址。後來了解到客戶之前還有一條到百度雲的專線,已經停用但是沒有走流程讓合作商清空配置,導緻了後來恢複的時候學習到了百度雲的mac。

客戶之是以能ping通互聯位址,因為客戶之前百度雲拉的專線互聯位址和這次到騰訊雲位址172.18.67.1 是一樣的。

案例2:因路由收發網段問題導緻專線通道不通

客戶故障背景:

客戶IDC和騰訊雲是通專線BGP路由接入打通騰訊雲和AWS,兩端各有1台雲主機,發現騰訊雲機器到aws機器不通,隻有1跳路由。

騰訊側互聯IP198.19.254.114/30

使用者側互聯IP198.19.254.113/30

騰訊雲位址:10.1.2.11、10.1.2.6

AWS位址:192.168.1.81

雲雜談:專線故障排查案例分享,理順思路

客戶專線互聯拓撲

雲雜談:專線故障排查案例分享,理順思路

騰訊雲到aws

排障思路:

1、确認aws的機器traceroute能夠到專線互聯位址,說明aws側能正常學習到騰訊雲的路由

雲雜談:專線故障排查案例分享,理順思路

aws可以到騰訊雲互聯位址

2、核查兩側實體端口都是正常up狀态。

3、騰訊雲無法到對端互聯位址,說明騰訊雲側沒有正常學習到aws路由。登陸騰訊雲接入裝置核查路由,發現有收到,但是騰訊雲後端裝置沒有收到對應路由。

雲雜談:專線故障排查案例分享,理順思路

接入裝置能收到路由

4、确認發現客戶釋出路由網段不符合騰訊雲接受網段要求,騰訊雲控制台會有相對應提醒

https://cloud.tencent.com/document/product/216/546

雲雜談:專線故障排查案例分享,理順思路
雲雜談:專線故障排查案例分享,理順思路

原因分析:

客戶釋出路由網段不符合騰訊雲接受網段要求。

總結

專線場景遇到的問題多種多樣,這裡也不一一陳述。所遇問題無非幾種原因:

1、實體裝置端口是否正常,光子產品收發光等

2、兩端是否進行了正常的路由收發

3、部分雲廠商限制(如上面說的網段限制,路由條目數量限制等)

4、正确的mac表

。。。