繁體中文

光模組故障怎麼處理?詳見三大類故障排查及解決方法

發佈於 2020年04月14日 by
11.4k

客戶在使用光模組時或多或少會遇到各種各樣的故障問題,像光模組型號選用是否正確、使用的跳線是否正確等一些常見問題,客戶是有判斷能力且有明確的解決方法,但對於某些使用時出現的故障問題,如傳輸異常等,很多客戶不知道該如何排查並解決。本文將重點教您如何排查並解決常見的三大類光模組故障問題。

一、傳輸類的光模組故障排查及解決方法

該類光模組故障主要包含端口不UP、端口狀態為UP但不接收或發送報文、端口頻繁up或down以及CRC錯誤。具體光模組故障排查方式及解決方案如下:

1、端口不UP

10G SFP+/XFP光模組為例,當光模組光口與其他設備互連不能UP時,可從以下五個方面進行排查:

第一步,檢查兩端端口的速率和雙工模式是否匹配——執行“show interface brief”命令進行查看,若是不匹配,通過speed命令和duplex命令配置端口的速率和雙工模式。

第二步,檢查設備端口與光模組的速率、雙工模式是否匹配——執行“show interface brief”命令進行查看,若是不匹配,通過speed命令和duplex命令配置端口的速率和雙工模式。

第三步,檢查兩端端口是否正常——通過環回測試兩端端口是否能UP。在單板上的10G SFP+端口上使用10G SFP+直連線纜(適用於短距離連接,或用SFP+光模組和光纖跳線)進行互連,10G XFP端口上使用XFP光模組和光纖來進行測試,查看該端口是否能UP。如果能UP,則說明對端端口異常;如果不能UP,則說明本端端口異常。可通過更換本端、對端端口來檢查故障是否解決。

第四步,檢查光模組是否正常——主要是檢查DDM、光功率、波長、距離等參數是否正常,若是不正常,則通過更換與光接口匹配的光模組。

  • DDM信息——通過“show interfaces transceiver detail”命令檢查參數是否正常,若出現告警,則表示該光模組有故障或該光模組與光接口類型不匹配。

  • 光功率——使用光功率計測試端口收發光功率是否在正常範圍內及穩定。

  • 波長/距離——通過“show transceiver interface”命令檢查兩端光模組波長、距離等是否一致。

第五步,檢查光纖是否正常——如,單模SFP+光模組搭配單模光纖,多模SFP+光模組搭配多模光纖,若是不匹配立即更換與之相匹配的光纖即可。

若是按照上述步驟仍未找到光模組故障原因或解決光模組故障問題,建議您直接聯繫供應商的技術人員尋求技術幫助。

2、端口狀態為UP,但不接收或發送報文

當端口狀態為up,卻不能接收或發送報文時,從以下三個方面進行故障排查:

第一步,查看端口報文統計結果。檢查兩端端口狀態是否一直UP,並且檢測兩端的報文統計是否增長。

第二步,檢查端口配置是否影響報文的接收。首先檢查是否做過網絡配置,核查配置是否正確,必要時全部刪掉再測試看問題是否解決;其次檢查端口MTU值是否為1500,若是大於1500,則需修改配置。

第三步,檢查端口及鏈路截止是否正常。更換連接端口,將其連接到其他端口查看是否存在相同現象,若是仍然故障,則替換光模組。

若是按照上述步驟排查後,光模組故障問題仍未得到解決,則建議您直接聯繫供應商的技術人員。

3、端口頻繁up或down

當光模組的光端口頻繁up或down時,先確認光模組是否異常,可通過查看光模組alarm信息來排查兩端光模組及連接光纖問題;對於支持數字診斷功能的光模組可通過查看DDM信息確認光模組的光功率是否處於臨界值,若是發射光功率處於臨界值,則更換光纖、光模組作為交叉驗證,若是接收光功率處於臨界值,則排查對端光模組及連接光纖。當電口光模組出現該情況,嘗試設置速率雙工。

若是排查完鏈路、對端設備以及中間設備後,光模組故障仍然存在,則建議您直接聯繫供應商的技術人員。

4、CRC錯誤

第一步,先查看報文統計信息判斷故障問題。通過“show interface”命令,查看端口出入方向的錯包統計確定體積是哪項增長,從而判斷故障問題。

  • 端口入方向出現CEC、frame、throttles錯包且計數持續增加——使用儀器測試鏈路是否故障,若是故障則更換網線或光纖;或者更換網線或光纖光模組與其他端口連接,若是端口更換後錯包又再次出現,則視為單板端口故障,若是更換到正常端口仍出現錯包,則對端設備、中間傳輸鏈路故障的可能性較大,排查即可。

  • 檢查端口入方向是否出現overrun錯包且計數持續增加——通過多次執行“show interface”命令查詢input errors是否有增加,若有則代表着overruns增加,單板內部可能擁塞或堵死。

  • 檢查端口入方向是否出現giants錯包且計數持續增加——檢查兩端Jumbo配置是否一直,如端口默認的最大報文長度是否一致,允許最大報文長度是否一致等。

第二步,檢查光模組的光功率是否正常。通過“show transceiver interfaces detail”命令查看光口所插光模組的數字診斷參數的當前測量值。若是光模組的光功率不正常,則需更換光模組。

第三步,檢查端口配置是否正常。通過“show interface brief”命令查看端口配置是否有異常,其中兩端的協商狀態雙工模式和端口速率是否一致,若是存在半雙工模式或速率不一致,則通過duplex命令和speed命令分別配置雙工模式和端口速率。

第四步,檢查端口及鏈路介質是否正常。更換連接端口查看是否存在相同現象,若是存在相同現象,則檢查連接鏈路中中間設備以及傳輸介質是否正常,若是正常,則替換光模組。

第五步,檢查端口是否收到大量流控幀。通過“show interface”命令,查看端口pauses幀計數,若是不斷增長,則說明該端口發出或接收到了大量的流控幀。另外,檢查端口出入流量是否過大以及對端設備的流量處理能力。

經過上述檢查後,若是配置、對端以及鏈路都沒有問題,但光模組故障問題仍然存在,那麼請直接聯繫供應商的技術支持人員。

二、信息讀取異常類的光模組故障排查及解決方法

1、顯示不支持

當查看系統日誌時發現存在上報非合法光模組信息,如unqualified、unapproved、unknown等,則先檢查編碼信息,若是編碼出現差錯,則重新編碼,若是編碼正確,可聯繫供應商的技術支持人員尋求幫助。

2、不支持DDM

當系統提示光模組不支持數字診斷(DDM)時,通過“show transceiver interfaces detail”命令查詢使用的光模組是否支持數字診斷功能,或直接聯繫供應商諮詢該光模組是否支持數字診斷功能。若該模塊支持數字診斷功能,卻沒辦法解決故障,直接聯繫供應商的技術支持人員尋求幫助。

3、DDM異常

當安裝光模組的接口無法正常工作時,可根據以下三步驟進行故障排查:

第一步,檢查光模組Alarm告警信息。若是告警信息中存在接收有問題,一般是對端端口、光纖或中轉設備所導致的;若是存在發送問題或者電流、電壓異常,則需排查本端端口。

第二步,檢查光模組的接收、發送光功率是否正常。可通過“show interfaces transceiver detail”命令,查詢光模組的接收/發送光功率是否正常,以及其他參數是否在閾值範圍內;或者通過實時查詢,檢查光功率、溫度、電壓、偏直電流等參數是否正常。

第三步,檢查是光模組本身故障還是相鄰設備或中間連接鏈路故障。可更換端口、光模組等來進行交叉驗證。

經過上述步驟,仍然無法確認或解決光模組故障,可聯繫供應商的技術支持人員需求技術幫助。

三、硬件類的光模組故障排查及解決方法

硬件類的光模組故障排查主要是從光模組自身出發。首先,需確保購買的光模組品質經過認證,若是沒有認證,質量無法得到保障,建議不再使用該光模組;其次,檢查光模組的金手指是否有損傷,若是有損傷則需替換光模組;最後,檢查接口是否受到污染或損傷,若是接口有污染清潔即可,若是有損傷建議替換。

總結

為了大大減少光模組在使用中故障發生的概率,建議選用性能可靠穩定且品質有保障的光模組,與此同時,也要懂得正確專業的操作方式,如網線或光纖跳線和其他相關設備等。


相關文章推薦:

光模組安裝使用的常見問題解答

判斷光模組是否有問題,有幾種方法?

相關文章推薦

技術博文
See profile for Jesse.
Jesse
光分路器光衰多少,如何計算和測量?
2022年01月25日
17.6k
技術博文
技術博文
See profile for Audrey.
Audrey
FTTH網絡應如何設計分層與分光比?
2022年01月25日
4.8k
技術博文
技術博文
技術博文
See profile for Audrey.
Audrey
揭秘光分路器類型及選擇
2022年01月24日
4.4k
技術博文
See profile for Audrey.
Audrey
一文教您認識光分路器
2022年01月24日
7.0k
技術博文
See profile for Jesse.
Jesse
家庭網絡怎麼布線?家用網線布線指南
2021年12月31日
2.7k
技術博文
技術博文
See profile for Howard.
Howard
BPG的定義和工作原理是什麼?
2024年09月19日
28
技術博文
See profile for Audrey.
Audrey
數據中心預端接主幹銅纜解決方案
2021年12月31日
2.3k