在對網絡的管理和維護過程中,我們可能經常會遇到網絡傳輸延遲導致上網連接時斷時續或者出現上網速度異常緩慢的故障現象,并且,可能是一會正常,一會不正常,對于這類故障,相信是網絡管理中比較難于判斷和處理的。在對這類故障的處理中,通常的做法首先是采用ping測試,ping網關、DNS或者外網IP的時候,幾乎都會出現丟包或較大延遲的現象。那么,我們該如何準確、有效及快速的解決這類網絡故障現象?以下是我自己在遇到此類故障時的一些解決方法和一點心得,希望和廣大網管共同分享!
故障回放
我們單位是一家以機械為主的制造企業,規模不大,局域網的只有近100臺計算機,都同時接入到了互聯網,網絡結構也比較簡單,外網進來接的是俠諾路由器,路由器下接的是俠諾三層交換機,在交換機上做了VLAN劃分,192.168.0.0/24為服務器群,其中,192.168.0.3同時提供DHCP、DNS以及AD域控服務,其他的VLAN有192.168.10.0/24、192.168.20.0/24等共5個VLAN,局域網網絡運行一直比較穩定。由于最近網絡做了改造,采用了雙WAN口訪問,所以重新配置了路由器,網絡產生了一些異常故障,具體現象為:某VLAN內的主機突然發生網絡傳輸中斷故障,不能連接192.168.0.3服務器,但是一段時間后(幾分鐘或幾小時)又自動恢復正常,產生這種故障的主機不確定是某一臺,偶爾是這臺,偶爾又是另外一臺,在故障發生的時候,ping服務器192.168.0.3,均能夠ping通IP地址,但卻不能ping通域名,檢查DNS服務器,未發現任何錯誤。
故障排查
經過分析,初步認為該故障多半與廣播風暴、網絡病毒攻擊等因素有關。為了進一步查找和定位故障原因,于是將筆記本連接到交換機上鏡像端口,并運行科來網絡分析系統來捕獲網絡的數據包通訊,希望能夠借此快速的查明原因。
大約2分鐘后,停止捕獲,現在對捕獲的數據包進行詳細的分析,具體分析如下:
首先,通過科來的概要統計來看,網絡的流量、廣播流量、數據包大小分布以及TCP連接的信息均沒有發現異常,隨后,在診斷視圖下看到,發生的網絡事件全是ICMP主機重定向,達到了1771次,如下圖1:
查看這個事件的參考信息:“路由器向源主機發送一個主機重定向報文通知源主機有一條到達目的主機的更好的路由”。因此,從診斷視圖的ICMP主機重定向,我們得到了一個重要的提示:網絡中可能存在環路。再來到數據包視圖,可以詳細的查看到產生該問題的原因。打開數據包視圖,數據包的概要統計如下圖2所示:
選擇第1和第2個數據包,其詳細的解碼如下圖3所示: