2010年9月14日佛山大沥机楼网络故障日志
9月14日佛山大瀝機樓坐席接入NGCC平臺,組網是通過CN2組建VPN,將坐席直接接入到NGCC平臺網,再由NGCC平臺網出DCN網訪問應用服務器,同時通過長線DNS服務器出公網,故障是長ping路由節點和應用服務器都會直接丟包和延時。
為解決該故障,首先通過更換樓層交換機減少交換機端口接入量并重新配置協議排除樓層匯聚出CN2的故障,但樓層出CN2直到DCN和DNS仍是存在丟包和延時;其次tracert觀察走過的路由節點,發現ping到樓層匯聚正常,但到CN2就出現故障,于是把問題定位到接入CN2這一段;最后切換佛山PE接入CN2,觀察正常,確定是主佛山PE有問題。故障得以解決,但其中有兩點確值得學習:
1.人固有的自信和偏執會影響故障的處理。在處理故障時往往會以自己的解決方向為主導,但這個方向卻未必正確,從而使故障陷入僵局。比如撥打測試接入碼上,告訴其一大串號碼,卻只截取其中的一部分,并認為撥打號碼中的一部分會接入其他局,而實際卻是如此,但因其略懂這些號碼的常識,便自信而且固執地截取了接入碼中一部分來撥測,顯然無法達到預期效果;再比如,故障顯然有應用服務器和DNS都無法正常通信,這個時候處理故障就走到DNS故障上,于是又折騰了大半天,而其實非DNS故障,因為DNS和應用服務都在DCN網,到DCN網有問題自然到二者都有問題,最后終端取消DNS,故障依然存在,才排除了這點,最后再走應用服務器這條線,從NGCC平臺網到DCN又排除后才將接入CN2的PE納入故障范圍,而實際上一開始就應該從接入著手,這也是因處理人當時的方向判斷錯誤;
2.遇到問題或故障時冷靜和談定是先決。昨天故障處理一天下來,包括廠家工程師都處在極度煩躁中,沒有人找到正確的方向去處理,只是在一頓抱怨。最后廠家陳總來定,打開組網圖,一段一段ping,仔細觀察,將問題定位到接入CN2的佛山PE,有分析能力還有實際操作的解決能力,這樣的領導確實不多見,也使我對這個廠家由起初的鄙視轉為認真評估,有此領導,這個廠家必有一定能力,能將方法和工具相結合去解決問題才是高手,如此領導實則少見。
?
廠家雖然在故障時故意搪塞和推卸責任,并把問題本質顛倒,但顯然都是為了免責,我之前一直認為廠家無能力顯然是自己愚蠢了,太低估對方大智若愚的智商了。我雖然心中對組網清晰,也想一段一段去跟,但我的角色非主導,而當時處理人的思路又無法統一到我這里,所以我相信在這個故障上,我是分析到位,為了證明主導人解決方向錯誤,我直接在DNS上做證明,結果不管有沒配置DNS,都出現丟包和延時,才讓主導人回到正確方向上,最后陳總過來,坐下來冷靜地一段段觀察,才定位主因。
?
從此次故障學習到:一是一旦陷入自信和固執或出現糾結,要適當地跳出來冷靜分析和思考,同時在他人陷入錯誤方向時也應找到正確的方法和工具證明錯了,才能使問題回到正確方向上,這點昨天已經做到了,但需要避免自己陷入這樣一個困境;二是像廠家陳總那樣,遇到問題和故障,先冷靜,然后做下來找方法和工具,有方法沒工具是突然,有工具沒方法無所用,這點顯然我自己已經做到了,但仍有待進一步學習,我雖非網絡專業,但昨日也收獲不少,ping/telnet/tracert幾個命令還有寫個bat就搞定,非此專業卻仍具備分析和處理能力,證明做事邏輯的重要性,一理通百事明。
總結
以上是生活随笔為你收集整理的2010年9月14日佛山大沥机楼网络故障日志的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 搭建Java ME 开发环境
- 下一篇: bat输出log日志操作