天天看點

記一次網絡環路引起的大面積網絡故障

斷網是最嚴重的網絡問題。

尤其對于醫院來說,斷網意味着醫院最基本的挂号、看診提示、錄入病人資訊等系統全部都要改為人工,嚴重影響到了醫生治病救人的效率,這可是人命關天的大事。

今天我就遭遇了一起非常嚴重的網絡故障,醫院門診樓所有醫生站全部無法連接配接内網。可造成該網絡故障的原因卻隻是一根網線的拔插。

沒錯,就是接入交換機二層環路引起的斷網事故。

某天下午14點18分,正當我還在享受悠閑的午後,客戶突然傳來消息,“不好了,醫院内網所有醫生站,還有一些醫生辦公室不能上網了,網管系統上有環路告警”,

我說别着急,我先遠端看一下。

我一如既往地打開軟體準備遠端檢視故障節點,這時候我卻發現,故障節點裝置徹底斷網了。

“完了,事情嚴重了,這次的環路影響面積有點大”

于是我馬上打了個車趕到了客戶現場,第一件事情就是拔掉了出現環路告警接口的網線,此時,部分網絡已經恢複正常。剩下的事情,就是找到到底是哪裡出現環路了。

但是客戶環境比較複雜,沒有人記得這一台出現環路的交換機安裝在哪裡,樓上樓下找了一個小時,但是還是沒有找到這台出現環路的交換機在哪裡,此時部分的醫生站還是無法連接配接内網,我急了,但是還是得保持鎮定,開始根據其他交換機的鄰居資訊逐級找到和故障節點級聯的裝置。

沒有辦法,我把這台出現環路的交換機對端的接口全部關閉,先讓這台交換機和内網隔斷,然後用和原本和其他交換機級聯的網線,接到自己的電腦上遠端登入上了故障節點。

終于登入到出現環路的交換機,第一件事就是檢視鄰居,由于我已經把原本和他級聯的裝置的接口全部關閉,此時應該是沒有鄰居資訊才對,但是這台交換機上卻出現了一個鄰居,并且檢視詳細資訊可以發現是一台内網的交換機。

這和我記錄的拓撲不一樣啊!!

如果按照原有的拓撲,應該隻有一台内網交換機與這台交換機級聯才對,現在突然多出了一台内網交換機。

找到多出的這台内網交換機後,到對應樓層弱電井一看,發現和故障交換機連接配接的接口上的網線标簽資訊是錯誤的,而且客戶現場正在進行搬遷,可能是搬遷過程中有人進行了線路的調整,最後把線給插錯了,也沒有發現自己插錯線了,才造成了這次事故。

這個環路讓内網醫生站和醫生辦公室所屬vlan形成了二層環路,由于該vlan與網際網路的某個網段為複用關系,同時也造成了該網段部分電腦無法上網,好在網際網路那端的交換機開啟了STP,才沒有造成更大的傷亡,隻影響了該交換機下接的網際網路電腦。

解決了環路,醫院的網絡也恢複了正常。我才終于放下心來。

最後在這裡溫馨提示,不要亂插交換機的網線,對了,牆上出來兩根網線也不要同時插進路由器的兩個lan口,你的一次無心操作可能會給一個無辜的網工造成沉重的心理陰影。

繼續閱讀