190 likes | 357 Views
障礙管理 ( Fault Management). 陳彥錚 ( Yen-Cheng Chen) yencheng@mcu.edu.tw http://www.im.tj.mcu.edu.tw/~ycchen/. 障礙管理( FM) 定義. Fault Management (FM) Detection of a problem, fault isolation and correction to normal operation. 障礙管理 儘早偵測問題之發生,進行障礙之隔離,進而解決改正問題,使網路或系統恢復正常運作。. 障礙管理之功能.
E N D
障礙管理( Fault Management) 陳彥錚 (Yen-Cheng Chen) yencheng@mcu.edu.tw http://www.im.tj.mcu.edu.tw/~ycchen/
障礙管理(FM)定義 • Fault Management (FM) • Detection of a problem, fault isolation and correction to normal operation. • 障礙管理 • 儘早偵測問題之發生,進行障礙之隔離,進而解決改正問題,使網路或系統恢復正常運作。
障礙管理之功能 • Maintain and examine error logs • Accept and act upon error detection notifications • Trace and identify faults • Carry out sequences of diagnostic tests • Correct faults
障礙管理實施步驟 • 發現障礙 • Identifying the occurrence of a fault on the network. • 隔絕障礙 • Isolating the cause of the fault. • 排除障礙 • Correcting the fault.
發現障礙 • 事件報告 (Event) • 網路設備自行發現問題時,主動向網管系統發出事件報告(Event Report)。 • 注意:當網路設備完全故障時,無法發出任何事件報告。 • 週期性探詢(Polling) • 網管系統每隔一段時間主動發出偵測訊息至被管設備,或向被管設備要求障礙相關網管資訊 。
探詢週期 • 障礙監測之探詢週期一般設為5~15分鐘 • 探詢週期決定因素: • 及時性需求 • 被管設備之數目 • 網路頻寬 • 處理時間 • 網管通信協定之限制 例如: SNMP: Counter (32-bit) 資料歸零問題
補充資料 PING • PING: Packet Internet Groper • PING為一利用ICMP ECHO / ECHO Reply所設計之TCP/IP網路探測工具。 • 功能: • 測試可否通達某一主機 • 計算封包來回時間 (Round Trip Time) • 估算封包漏失率 (Packet Loss Rate)
補充資料 PING 實例
作業一 • 選定一網站,利用Ping偵測,說明偵測結果。 • 自行選用Ping工具 (Windows 98/NT、UNIX、或老師提供之Web-Based工具) • 下次上課時交。
補充資料 事件篩選與轉送 • Event Filtering and Forwarding • 較複雜或重要的網路設備(例如電信網路設備),可能會傳送出許多事件。 • 這些事件種類煩多、其重要性也不同。 • 負責處理各事件之應用程式或管理人員也可能不同。 針對所發出之事件進行篩選與轉送。
補充資料 事件篩選轉送機制 • ISO/ITU-TX.734 事件篩選轉送機制 • 事件轉送鑑別器 EFD (Event Forwarding Discriminator) • 可依據事件發生之物件、事件之型態、事件發生之時間進行篩選。 • 對於篩選通過之事件可指定轉送至某一目的地,當此目的地無法接收時,甚至可以設定送至另一備援目的地。 • 註: • EFD為一軟體物件(Object) 。 • EFD可置於管理者端或被管理者端。 • EFD物件個數依需要而定,每一EFD代表一種事件篩選轉送方式。
網管系統障礙管理功能 • 問題偵測 • 利用類似Ping方式,對每一被管設備進行偵測。 • 問題存錄(Log) • 將發生問題之設備名稱、問題發現時間、可能原因等資訊記錄於存錄(Log)檔案中。 • 狀態顏色改變 • 改變在網管系統圖形化介面中代表發生問題之設備的圖示之顏色。 • 偵測介面狀態 • 每一網路設備可能含有多個介面卡(Interface),一般網管系統會監測每一介面卡之運作狀態(Operational Status)。
網管系統障礙管理功能(續) • 事件解譯(Interpret Event) • 將探詢(Polling)結果以及收到的事件,進行解譯與進一步測試,進而找出真正障礙,通知使用者。 • 事件關聯性分析(Event Correlation) • 將探詢(Polling)結果以及收到的事件,進行關聯性分析,進而找出真正障礙,通知使用者。 • 事件/動作(Event/Action)機制 • 網管人員可以設定當某一類事件發生時,網管系統應即刻執行哪些動作(應用程式)。
Event Poll Reply Network Polling Receive Network Event Critical Network Event Generate Generate Interpret Network Event 事件解譯 No Event= Link Down ? Alert User Yes Check Carrier Signal on Source Carrier Exist ? No Alert User Link Down Yes Put Interface in Loopback Test Physical Layer Alert User Remote Device Down Test Pass ? Alert User Physical Layer Down No Yes
障礙(事件)報告方式 • 文字 (Text) • 以純文字訊息方式,顯示於螢幕上或圖形化使用者介面上之事件瀏覽器。 • 圖示 (Picture) • 改變圖示顏色,或加以閃爍方式提醒網管人員。 • 聲音 (Audio) • 以聲響方式引起網管人員注意。 • Pager • 以B.B. Call或行動電話短訊服務方式,即時告知網管人員。 • E-mail • 以E-mail方式,通知網管人員或客戶。
區 子區 POP 設備狀態與圖示顏色 POP 一般節點 Mail伺服器 WWW伺服器 DNS伺服器 其他 RAS T1介面 Channel/Port Critical Major Minor Warning Normal Unknown Disable
圖示顏色例子 State Critical Major Minor Warning Normal Unknown Color Packet Loss Rate >80% >60% >40% >20% <20% > Threshold Round Trip Time
Alarm Reporting • Round Trip Time Threshold Setting • Trouble Ticketing • Audio Alarm • Pager Alarm • E-Mail Alert