650 likes | 848 Views
SS005301 SDH故障处理与案例分析. 固网产品课程开发室. 引入. 本课程通过讲述 SDH 的逻辑功能块,分析告警产生的机制和流程;通过对故障现象地讨论,总结故障现象及处理步骤。结构上分为 4 部分: SDH 的 逻辑 功能块及告警流程图 常见的告警及性能事件介绍 讨论具体的故障现象和处理步骤 总结故障定位的基本思路及方法. 学习目标. 1 、了解 SDH 常见告警的产生机制 2 、掌握故障定位的基本思路 3 、掌握分析和定位的几种基本方法 4 、掌握几种常见分类故障的处理方法. 学习完本课程,您应该能够:. 课程内容.
E N D
SS005301 SDH故障处理与案例分析 固网产品课程开发室
引入 本课程通过讲述SDH的逻辑功能块,分析告警产生的机制和流程;通过对故障现象地讨论,总结故障现象及处理步骤。结构上分为4部分: • SDH的逻辑功能块及告警流程图 • 常见的告警及性能事件介绍 • 讨论具体的故障现象和处理步骤 • 总结故障定位的基本思路及方法
学习目标 1、了解SDH常见告警的产生机制 2、掌握故障定位的基本思路 3、掌握分析和定位的几种基本方法 4、掌握几种常见分类故障的处理方法 学习完本课程,您应该能够:
课程内容 第一章 SDH的逻辑功能块 第二章 常见的告警与性能事件 第三章 故障现象讨论 第四章 故障定位的基本思路
SDH的逻辑功能块 一、SDH的基本逻辑功能块 二、SDH的辅助逻辑功能块 三、SDH的告警流程图
SPI SPI:同步设备物理接口功能块(A—B) SPI 同步设备 物理接口 收方向 A→B 发方向 B→A E/O变换 O/E 提取线路定时 失效 RLOS
SDH基本逻辑功能块 A、B、C点信号帧结构:
RST RST:再生段终端功能块(B—C) 收方向 B→C RLOS C点信号 全“1” 定帧 A1、A2 失败 ROOF、RLOF C点信号“1” 正常 解扰 处理E1、D1-D3 校验B1 RS-BBE
RST RST:再生段终端功能块(B—C) 发方向 C→B 写RSOH 加扰 STM-N帧 计算B1 加入E1 D1-D3
SDH基本逻辑功能块 D点信号帧结构 再生段和复用段的区别
MST MST:复用段终端功能块(C—D) 收方向 C→D 检测B2 提取APS信令 K1、K2(b1-b5) 检测K2(b6-b8) 111 MS-AIS D点信号“1” 越限 MS-EXC(B2) D点信号“1” 110 MS-RDI 不符 MS-BBE
MST MST:复用段终端功能块(C—D) 发方向 D→C 写MSOH K2→110 MS-RDI 收MS-AIS时 M1→MS-REI 收MS-BBE时
MSP与MSA MSP:复用段保护功能块(D—E) • 进行复用段保护倒换的启动条件RLOS、RLOF、MS-AIS MSA:复用段适配功能块(E—F) 发方向 F→E 写指针 AU-PTR 字节间插 N×AU-4→AUG
MSA MSA:复用段适配功能块(E—F) 收方向 E→F 消间插 AUG→ N×AU-4 解读指针 AU-PTR H1H2H3全“1” AU-AIS F点信号全“1” 无效指针 8个NDF AU-LOP→F“1”
SDH基本逻辑功能块 261 1 VC4 F点信号帧结构: 9 260 1 C4 G点信号帧结构: 9
HPC与HPT HPC:高阶通道连接功能块(F—F) 对VC4的交叉矩阵 仅选择路由,不处理信号 对应SBS2500设备X16板 HPT:高阶通道终端(F—G) HPOH源和宿 对高阶VC4进行实时监控 发方向 G→F 写HPOH G1→HP-RDI 收HP-TIM、HP-SLM HP-UNEQ G1→HP-REI 收HP-BBE时
HPT HPT:高阶通道终端(F—G) 收方向 F→G 检测B3 不符 HP-BBE 检测J1 失配HP-TIM G点全“1” 检测C2 失配HP-SLM 00H HP-UNEQ H4传给 HPA G点全“1”
HPA HPA:高阶通道适配功能块(G—H) 收方向 G→H 消间插 C4→TU12 处理指针 TU-PTR、TU12→VC12 V1V2V3“1” TU-AIS H点全“1” 无效指针 TU-LOP H点全“1”
HPA HPA:高阶通道 适配功能块(G—H) 发方向 H→G 写指针 TU-PTR、VC12→TU12 字节间插 TU12→C4
SDH基本逻辑功能块 H点信号帧结构 I点信号帧结构
SDH基本逻辑功能块 LPC:低阶通道连接功能块 对VC12、VC3的交叉矩阵 仅选择路由,不处理信号 对应SBS2500设备TXC板 LPT:低阶通道终端 LPOH源和宿 对低阶VC12进行实时监控
SDH基本逻辑功能块 LPT:低阶通道 终端(H—I) LPT 收方向 H→I 发方向 I→H 检测V5 LP-BBE LP-TIM、LP-SLM,LP-UNEQ 写LPOH 收LP-BBE→LP-REI 收LP-TIM、SLM→LP-RDI
SDH基本逻辑功能块 LPA:低阶通道适配功能块(I—J) 包封/拆包封:PDH—C PPI:PDH物理接口功能块(J—K) 设备与PDH线路接口 提取PDH支路定时信号 码型变换:NRZ—HDB3、NRZ—CMI
二、SDH辅助逻辑功能块 SEMF:同步设备管理功能块 本设备各功能块的监控 其他设备间OAM信息互通 MCF:消息通信功能块 提供网管f&Q接口 提供D1-D3、D4-D12接口(P、N) SETS:同步设备定时源 提供本地时钟 4种时钟源 输出本地时钟 OHA:开销接入功能块 公务开销的接入:E1、E2、F1
课程内容 第一章 SDH的逻辑功能块 第二章 常见的告警与性能事件 第三章 故障现象讨论 第四章 故障定位的基本思路
常见告警及性能事件 一、什么是SDH告警 二、SDH告警的分类 三、SDH常见性能事件的分类
一、什么是SDH告警 • SDH告警的定义 • 网元产生——网元指示灯或网管指示 • SDH告警的特点 • 原发告警、伴随告警 • 告警的速率标志
二、SDH告警的分类 • 输入信号丢失(LOS) • 帧定位丢失告警(LOF) • 连续4帧A1A2错误—OOF帧失步指示 • OOF超过3ms—LOF告警
二、SDH告警的分类 • 上游故障告警(AIS) • 指针丢失(LOP) • 连续8帧无合法的指针值 • 过误码(EXC BER) • 误码率BER 〉1*10-3
二、SDH告警的分类 • B1,B2,B3误码(ERROR) • B1的作用是再生段误码监视 • B2的作用是复用段误码监视 • B3的作用是高阶通道误码监视
二、SDH告警的分类 • 远端误码指示(REI) • MS-REI、HP-REI、LP-REI • 远端缺陷指示(RDI) • MS-RDI、HP-RDI、LP-RDI
二、SDH告警的分类 • 通道接入点标识不匹配(TIM) • J0(复用段)、J1(高阶通道)、J2(低阶通道) • 负荷标签不匹配(PLM) • C2(高阶通道)、V5(低阶通道)
三、SDH常见性能事件的分类 • 误码秒(ES)、严重误码秒(SES) • 、不可用秒(UAS) • ES表示传输过程中至少有一个误码的秒 • SES表示误码率 〉10-3的秒 • UAS的开始是连续出现10个SES • UAS的结束是连续出现10个非SES
三、SDH常见性能事件的分类 • 背景误码块(BBE) • BBE表示同一块中的任意比特发生差错的块 • 指针调整统计(PJC) • 帧失步(OOF) • 保护倒换(PS)
课程内容 第一章 SDH的逻辑功能块 第二章 常见的告警与性能事件 第三章 故障现象讨论 第四章 故障定位的基本思路
讨论故障现象与处理步骤 一、故障现象讨论 二、故障的分类与处理步骤
一、故障现象讨论 • 讨论业务中断的原因? • 外部原因 • 人为原因 • 设备本身故障 • 供电电源故障,如设备掉电、供电电压过低等 • 交换机故障 • 光纤、电缆故障。如光纤性能劣化、损耗过高, 或光纤损断;中继电缆脱落、损断或接触不良等 • 误操作设置了光路或支路通道的环回 • 误操作更改、删除配置数据 • 单板失效或性能不好
一、故障现象讨论 • 讨论传输误码的原因? • 外部原因 • 设备故障 • 光纤性能劣化、损耗过高 • 光纤接头不清洁或连接器不正确 • 设备接地不好 • 设备附近有强烈干扰源 • 设备散射不好、工作温度过高 • 线路板接收侧信号衰减过大、对端发送 电路有故障、本端接收电路故障 • 时钟同步性能不好 • 交叉板与线路板、支路板配合不好 • 支路板故障 • 风扇故障 • 单板失效或性能不好
一、故障现象讨论 • 讨论业务丢失的原因? • 人为原因 • 业务开通后,未对数据做备份 • 静态库SDB——闪存库(FDB0、FDB1) • 多网管操作的结果
一、故障现象讨论 • 讨论公务电话故障的原因? • 外部原因 • 人为原因 • 设备本身故障 • 光纤断会导致正在通话的公务电话单通 • 公务配置数据错,包括“允许通话逻辑系统” 、“呼叫等待时长”、“电话号码”等 • 支持公务电话的单板失效或性能不好
一、故障现象讨论 • 讨论出现大量指针调整的原因? • 外部原因 • 人为原因 • 设备本身故障 • 光纤接反,出现两个网元间时钟互锁的情况 • 时钟源配置错误,出现同一个网中有两个时钟源的情况 • 时钟源配置错误,出现两个网元间时钟互跟的情况 • 线路板故障,提取时钟质量不好 • 时钟板故障,提供的时钟源质量不好 • 交叉板故障,给各单板分配的工作时钟质量不好
一、故障现象讨论 • 讨论网关网元登陆不上的原因? • 外部原因 • 人为原因 • 设备本身故障 • 网线选择错误或者网管台的网卡坏 • ID或IP地址设置 错误 • SCB板故障,无法PING通或者无法登陆 • 软件版本不匹配,主机版本较网管版本新
一、故障现象讨论 • 讨论非网关网元登陆不上的原因? • 外部原因 • 人为原因 • 设备本身故障 • 光纤故障,如光纤性能劣化、损耗过高,或光纤断 • 供电电源故障,如设备掉电、供电电压过低等 • ID设置 错误 • 网管中网关网元删除再恢复,非网关网元的网管属性丢失 • SCC板故障 • 光板故障 • 网元有大量的性能数据上报到网管
二、故障的分类与处理步骤 • 业务中断类故障处理 • 常用方法 • 告警分析法 • 逐段环回法 • 互换、替换法 • 处理步骤 • 检查各站登录是否正常,各站光路上是否有紧急告警。 • 检查业务中断站点支路板上业务通道,是否有T-ALOS告警。 • 逐段环回
二、故障的分类与处理步骤 • 误码类故障处理 • 常用方法 • 告警、性能分析法 • 逐段环回法 • 互换、替换法 • 处理步骤 • 根据告警及性能,分析是线路上还是支路上的误码? • 通过逐段环回法定位误码产生的位置。 • 根据定位的信息做排除或替换处理
二、故障的分类与处理步骤 • 指针调整的问题处理 • 常用方法 • 性能分析法 • 更改配置法 • 互换、替换法 • 处理步骤 • 排除光纤接反可能。只有在通道环的情况下,才可能发生 光纤接反的情况。其它组网下,光纤接反将导致业务中断。 • 检查配置,排除配置错误的可能。 • 分析指针调整性能事件,并通过更改时钟源位置以 及时钟跟踪方向等方法,定位故障点。
二、故障的分类与处理步骤 • ECC的问题处理 • 常用方法 • 告警性能数据分析法 • 替换法 • 处理步骤 • 排除外部因素,如掉电、光纤折断、光纤性能劣化等 将故障定位到单站或两个站之间。 • 对于ECC问题,逐段自环不能定位故障;一般根据从 哪一站开始不能登录来判断故障位置。 • 检查SCC板。 • 检查光板。
课程内容 第一章 SDH的逻辑功能块 第二章 常见的告警与性能事件 第三章 故障现象讨论 第四章 故障定位的基本思路