1、重点客户组网 E1 故障处理探讨段衍强 刘淼, (中国联通泰安市分公司,泰安,271000)摘要:本文是作者根据多年维护重点客户数字出租 E1 专线的基础上, 对 E1 线路在重点客户组网的应用方式进行了分类,对故障 处理进行分类总结, 为传输和客户 服务维护人员提供经验借鉴。关键词:E1 ;V.35;以太专线; 测试 ;定位; 故障引言:作者长期工作在运营维护的一线,在实际工作中总结出很多实践性性较强的故障处理经验。本文需要探讨的即是这类 PDH/SDH E1 组网的几种接口方式及故障处理方法。文章分为三部分:E1 专线组网的接口形式、基本故障处理步骤、疑难故障案例总结。随着通信技术手段的演
2、进,更主要是由于服务行业业务自身的演进,以金融、商贸为主的服务型行业对专网通信的要求越来越多样化,带宽越来越高,原有的 DDN、ATM 已经不能满足需要,在过去的 10 年左右时间里,PDH/SDH E1 专线组网成为运营商客户的主流需求。本文所述所有故障均为 E1 组网的故障。一、用户 E1 专线组网的接口方式1、 运营商直接给用户提供 G.703 E1 接口,用户设备包括 E1 接口路由器,语音交换机等。2、 运营商给用户提供 G.703 E1 接口+V.35 转换器,或者直接提供 V.35 接口,用户设备一般为 V.35 路由器,运营商提供的为 V.35 母头 DCE,用户路由器提供公头
3、 DTE。3、 运营商给用户提供 G.703 E1 接口+以太网转换器(俗称网桥) ,用户设备包括以太交换机、路由器,HUB,甚至直接是电脑。4、 除上述几中点对点的对等方式外,用户主网点一端使用 POS 口路由器,分点一端使用E1 或者 V.35,这也是业务汇聚型客户较多使用的一种组网方式。实际工作中,有用户要求一端使用以太口、另外一端要求使用 V35 接口或者 POS 口,这样的组网方式一般难以满足,除非中间使用复杂的转换设备如 MSAP,直接靠简单的 E1线路加单个转换器是无法完成的,对待用户此类要求,一定要慎重考虑后答复。二、基本故障的处理步骤结合上述 E1 电路的接口方式,从常见基本
4、故障到比较棘手、经常困惑维护人员几天甚至几个月的疑难故障,我们首先对故障处理的步骤进行一下总结:第一步:查询网管设备告警,预处理如果传输设备是 SDH 或者是有网管的 MSAP、PDH 设备,首先尽可能借助网管查看历史和当前告警,如掉电告警、光路告警、远端对高、E1 丢失告警,甚至是UP( DOWN) E1_AIS 告警也很有用途。根据这些告警,可以判定故障的大体段落,做到故障处理方向明确,而不是所有人员直接赶往用户端现场。即使赶往现场,提前预定位也可以提供有效信息,以便准备必要携带的工具、仪表等。以下着重讲一下经常被大家忽略的 UP(DOWN) E1_AIS 告警的用途。E1_AIS图 1:
5、E1_AIS 告警示意图很多 SDH 设备提供 UP(DOWN) E1_AIS 告警的功能,即上游或者下游 E1 帧结构告警指示信号。如图 1 所示,假设 SDH A、B、C 三站具备 UP(DOWN) E1_AIS 告警功能,在用户 A 和 C 之间故障时:如果 A 站上报 UP(DOWN) E1_AIS,则意味着 PDH 1 设备发送给 SDH A 的 E1信号(含二者之间的 E1 线缆)中断,故障点在 SDH A 站以下。如果 SDH B 站上报此告警,故障点在刚才的基础上再追加 SDH A 和 SDH B 之间的E1 接口线缆。根据上述网管提供的信息,我们大体上可以定位故障出在哪一端,
6、故障是设备、光缆还是电源,从而提高故障处理的总体效率。第二步:询问用户设备告警情况,初定位通过用户简单观察,可以了解如下几类情况1、 PDH 或者协转设备本身故障 用户会反映灯不亮、灯频闪异常。SDH A SDH CSDH BPDH 1 PDH 22、 光路故障 设备上会有光路丢失常亮、光路对端丢失闪亮等告警,根据不同厂家,告警描述会不同。如果是光缆故障,询问用户有没有整理线缆或者附近有无装修、施工等,尽快找到具体原因。还有一种情况就是光功率过强,超过该 SDH/PDH 设备的实际过载点,也会导致误码。如:一 PDH 的过载点在-8dBm 左右,发光在-5-0dBm,如果用户端和局端 2 台
7、PDH 距离太近,很可能就会导致光功率过强,超过过载点,这类故障隐蔽性较强,简单测试出现误码的话,有没有其他明显告警,优先考虑这个问题。通过测量实际光功率,然后加光衰的办法,可以解决此类故障。3、 对端设备故障 指导用户通过设备上的按钮操作,观察用户侧 PDH 对应的局端 PDH 的告警,可以进一步定位两端 PDH 是哪一端故障,或者光缆故障是单芯还是双芯,一般 PDH 支持此功能。4、 线缆或者接口故障通过指导用户观察光端机、V.35 、网桥等指示灯,定位出线缆故障:4-1 光端机报 E1 LOS,而网桥不报,则证明是网桥的发送、光端机的接收线缆故障;4-2 网桥以太接口不亮灯,则证明是网桥
8、故障或者用户与之接口的网线、交换机故障,指导用户自查内部设备和网线。4-3 V.35 TX 等不亮,则一般是与之接口的路由器端口故障或者 V.35 本身出了问题。5、 用户路由器或者交换机故障指导用户对交换机或者路由器进行简单观察,如路由器的运行等频闪、不亮灯,或者交换机的端口灯都同频闪烁,一般定为用户路由器故障或者交换机内部病毒攻击。第三步:现场测试1、 2M(E1)通道测试2、 V.35 测试3、 以太 ping 测试4、 在线测试其中第 1、2 类测试使用电信运营商常用的专业仪表,测试 G.703 和 V.35 通道的性能,主要是误码率。但是用户一般对这两类指标不是很了解,没有感性的认识
9、,通常不太好接受。 第 3 类测试用户容易接受,一般在用户许可的情况下,甩开用户局域网,用路由器的WAN 口或者直接用笔记本给用户做端到端的 ping 测试,由于电脑的普及,用户对此类结果比较认可。第 4 类测试一般在核心机房或者具备 DDF 在线测试条件的机房使用,主要仪表有误码测试仪、TTE 等,这类测试一定注意仪表采用跨接形式,最好使用高阻跨接,避免用户不允许的情况下造成用户业务瞬断。通过该类测试,对于中断类、严重误码类的故障,根据AIS、误码等告警很快可以定位故障来的方向是 A 端还是 B 端,派单维修时先考虑故障发生的一端,大大提高故障处理效率。第四步:替换法、配套设施排除法经过上述
10、一些较为常规的观察、测试之后,大多数故障都能解决。但是仍然有一些故障,测试正常之后,故障仍不能解决,这就需要我们用替换法来定位和解决故障,或者是仅仅用来寻找故障点,最起码给用户一个令人信服的结果。如关注用户电源、空调、发射器等设备对电路造成的影响,解决一些比较特殊而非共性的故障。三、疑难故障案例总结除掉上述简单容易判定的故障之外,还有几类故障不容易定位,包括设备不匹配、局域网病毒、环境干扰、设备性能指标下降等,这些故障通常隐蔽性较强,没有完备的测试仪表,因此也就没有既定的处理步骤,只能根据情况临时决定排查方向,根据多年实践,总结如下:1、 传输通道、路由器匹配故障案例一:泰安某商场火车站总部至
11、花园分店有故障,用户某一程序无法使用。故障初现象:从路由器 WAN 口上 ping 测试,分部到总部偶尔有丢包,端口有 CRC错误包增长。基本处理方式:经上述各类常规通道测试手段,没有发现通道异常,更换全程 PDH 接入设备和骨干传输通道的厂家,故障依旧。故障最终解决:临时将花园路由器由华为更换为 CISCO,所有故障现象消失。后观察数月,用户使用正常。故障定位:运营商提供的传输通道和用户华为路由器配合有问题,因为其他分部也使用华为路由器,因此,该问题为个别设备的配合问题。2、 用户局域网病毒故障此种情况下,常规通道测试没有任何异常,加入用户路由器测试丢包,甚至是不通,用户路由 WAN 口可能
12、会有 CRC 错误包增长,2-1 如果用户 A、B 两端都具备以太接口,而且两端客户都能配合,首选是两端都用笔记本甩开测试,测试正常,即可排除运营商原因。2-2 如果用户 A、B 不具备以太口直接测试条件,只有 B 端一端用户配合,此时最好的办法是甩开用户 B 的所有用户,仅保留路由器和 WAN 口,用 B 端路由器和 A 端路由器 ping 测试,测试结果正常,可以排除运营商原因,然后配合客户检查局域网。案例二:某地市法院至省院及县法院内网通信故障故障初现象:从路由器 WAN 口上 ping 省院测试,大量丢包, WAN 口为 E1 接口,端口有 CRC 错误包增长基本处理方式:经上述各类常
13、规通道测试手段,没有发现通道异常。测试结果用户认可,但是要求寻找故障点。测试过程中,发现用串口登陆用户路由器时断时续。故障最终解决:经用户同意,甩开用户局域网 LAN 口,仅保留至省院 E1 口,路由器连接顺利,观察 LOG 历史日志, CPU 使用率曾打到 97%以上,判定局域网内有病毒攻击。 逐个接入用户局域网交换机,最终发现 1 台 web 服务器入网时,路由器 CPU 占用立即升高,定位为 WEB 服务器病毒攻击。3、 机房电源干扰导致的故障 按照通信机房建设原则,机房应当实现信号线、交直流电源线的分离,然而很多客户机房因条件受限,布线不是很规范,有时会导致一些疑难故障的发生。主要因素
14、是交流电源、空调、大功率发射器等对 E1 信号线或者运营商提供的设备形成干扰,或者是机房接地不良,导致设备运行不稳定。案例三:某市邮政局故障至县局视频业务故障故障现象:原来正常使用的电路,突然间开始丢包,故障处理:传输通道测试正常,用户端口 CRC 错误增长,且情况极度不稳定,没有任何规律可循。进过多次处理,更换了所有的设备和通道,现象依旧。偶然发现,把传输 E1 线缆的转换器从地板下变换位置时,丢包现象立马消失,仔细观察地板下,发现用户电源线较多,主电源线和故障电路的 E1 线有交叉现象,应该是交流电源线对信号线形成干扰。反复进行试验,验证这一推断。故障解决:对用户线缆进行整理,把交流电源线
15、进行金属套管隔离,使信号线和电源线距离保持 20cm 以上,故障消失,用户业务稳定。案例四:某检察院 VIP 基站业务瞬断故障现象:某市检察院新增 VIP 基站,开通后业务经常闪断故障处理:传输通道测试、传输设备和基站设备、BSC 端口全部更换,故障现象依旧。后在用户端接入机房传输至 VIP 基站之间直接布放临时线,故障消失。后仔细分析,原来 VIP 基站到传输之间的走线跨越走廊,走廊两侧有主电源线被装修在内,应该是电源对传输 E1 线形成干扰。故障解决:由于实在无法避开该走廊和电源线,最后决定把跨越走廊的 E1 线缆更换为光缆,将 PDH 传输光端机直接拉伸到 VIP 基站机房,由于光信号传
16、输对周围环境的要求并不高,不论是电磁干扰或者是噪声干扰都很难干扰正常光信号的传播,故障解决。4、 传输 E1 阻抗匹配或者是 E1 接口性能下降导致的故障在实际应用 E1 接口分 75 欧姆和 120 欧姆,根据用户不同需求灵活配置,但是很多用户同时对这两类都有需求,很多同事为了应急可能会省掉 75/120 欧的转换器,在 E1 线路较短的情况下,业务不会发生问题。但是一旦设备老化 E1 接口性能时,会导致丢包现象的发生,常规的误码测试还不能发现,应当引起维护人员的重视。另外笔者在处理某公安系统故障时发现,运营商提供的华为 SDH 设备和公安系统自己采购的 PDH 通过 E1 线路对接,对接的业务经常出现故障,故障后的电路测试出现误码,SDH 支路板端口损坏。后仔细分析观察,发现 SDH 支路板的接线处有烧焦的痕迹,因此怀疑公安系统自购 PDH 光端机 E1 接口电平指标异常,强烈要求其更换正规厂家后,故障频率大幅下降。四、结束语:近年来,随着用户上下级管理关系和业务多样性的演变,2M 带宽的 E1 专线很难满足需求,速率更高、适应性更强的 MSTP 和 MSAP 业务浮出水面,成为大客户专网组网的主要业务方式。尽管用户端设备的形式会迅速改变,但是故障处理的思路和主要方式都和 E1故障处理有着极大的相似性,这些故障处理的经验仍将在维护中起到很好的借鉴作用。