1、,直放站故障处理,许华义武汉电信无线维护中心,2018/6/2,背景介绍,目前在中国电信整个网络运行中,直放站信源所采用的集成商主要有国人、京信、虹信、皓华、云海、三维、大唐等6个厂家的设备,在设备的维护当中我们不仅是考虑设备的正常运行工作,最关键的是我们还要对设备进行实时的网管监控,针对网管监控反馈回来的各种告警也是维护当中一项必不可少的工作。,网管实时监控的作用,网管的实时监控一方面可以很直接,很及时的让我们了解设备的运行状态,另一方面我们可以根据告警发生的状态迅速的判断出设备的故障所在,达到及时恢复设备的正常运行,保证整个网络的及时正常运行,直放站监控处理分类,在目前直放站监控处理这一块
2、,主要分为两个方面: 1、直放站设备监控无应答; 2、直放站监控出现的各种告警;,直放站设备监控无应答,针对直放站的无应答处理这一块,根据我们平时到现场处理过程中,可以初步的总结出来是以下五个方面造成的设备监控无应答:1、设备断电2、SIM卡欠费、无效或被盗3、设备监控模块(猫)坏4、SIM卡信息存储满5、直放站设备自身挂死,一、直放站设备断电,1、光纤直放站 在光纤直放站的近端机断电的情况下,远近断机都会出现无应答;在远端机断电的情况下一般不会出线无应答,只会出现告警的情况;2、无线宽带直放站 对于无线宽带直放站而言,只要是设备断电都有可能出现无应答,不是一定出现无应答,也有可能出现电源掉电
3、告警。解决办法:给现场设备正常通电,二、SIM卡欠费、无效或被盗,对于直放站设备监控所用的SIM卡,只要是欠费、无效或者是监控卡被盗的情况下,无论是光纤直放站还是无线宽带直放站监控都会出现监控无应答,而且是一定出现无应答。解决办法:更换一张正常的SIM卡,三、设备中监控模块(猫)坏,我们大家都知道,在所有的直放站设备中都有一个必不可少的模块,那就是监控模块(猫),它是和直放站网管平台进行通信的唯一渠道,无论是光纤直放站还是无线宽带直放站,只要是设备中的监控模块发生故障或者坏了不工作,网管监控平台在查询或者轮询的时候一定会出现无应答。解决办法:更换监控模块(猫),四、SIM卡信息存储满,其实用于
4、直放站监控所用的监控卡和我们语音所用的SIM卡是没有区别的,唯一的区别是监控卡只具备短信功能,而我们手机所用的SIM卡是语音和数据都具备的。 网管平台对现场设备的实时监控主要是通过短信进行通信的,所以监控所用的SIM卡就会在通信中存储大量的信息导致现场设备同网管平台无法进行正常通信而无应答。解决办法:取下卡槽中的SIM卡删除信息,五、直放站设备自身挂死,所谓直放站自身挂死并不是设备不正常工作,而是在同网管平台进行通信连接的时候无法正常的返回通信信息,导致现场设备和网管平台无法正常的进行通信。只要是通信返回时间超过设定的时间,网管平台就会出现无应答。解决办法:将设备断电重新启动,直放站监控出现的
5、各种告警,在直放站设备监控方面,所有的集成商设备所具备的告警使能都是相似的,唯一不同的是要看设备在运行当中集成商开启的使能告警是否全部放开,因为有很多集成商的在开启使能告警方面有很大的一部分是根据其自身的设备特点和告警的重要性来决定的。 目前直放站监控告警出现最多也是最关键的告警主要有以下7类:,1、光收发信号告警2、门禁告警3、电源模块掉点告警4、上先行链路告警5、下行驻波比告警6、上行功放告警7、底噪放模块告警,一、光收发信号告警,对于光收发告警的出现大概可以归结为以下6种情形a ,远端断电,近端机提示光收发信号告警,原因是近端机没有收到远端发过来的光。解决办法:一般只要将远端通电以后设备
6、恢 复监控正常。b ,近端收光弱,一般光缆受损或者远端断电导致收光弱,最后导致近端机收光达不到自身的收光门限,就会提示收光弱。解决办法:测试光衰,检查光路,C ,光缆或尾纤其中任意一条断了,近端没有收光,一般远近段都会光收发告警,有可能远端提示无应答。解决办法:重新布放光缆。d ,光收发模块坏,一般只要是光收发模块坏,近端机都会提示光收发信号告警。且告警无法正常消除。解决办法:更换光收发模块。,e ,设备出现误告警,网管提示光收发告警,一般现场联机调试正常,测试光路的衰耗也是正常,且光收发模块也运行正常,但是网管就是提示光收发信号告警。解决办法:持续观察3天座右,否则更换设备。f ,监控卡卡槽
7、松动,一般有部分厂家的卡槽裸露在外面,很容易在高温的情况下发生松动,导致监控无法正常通信出现无应答。解决办法:保环境温度,固定卡槽。,二、门禁告警,a ,设备的门自身没有关好,一般设备的门打开没有关好的情况下,设备自身都会提示门禁告警。解决办法:把设备的门关好就可以了。b ,设备存在误告警,平时我们发现门禁告警一般到现场关好门以后就可以消除门禁告警,但是网管就是提示门禁告警,我们可以初步断电是误告警。解决办法:持续观察,检查门禁线缆。,三、电源模块掉电告警,电源模块掉点故名思意就是电源掉电,设备无法正常工作:a ,设备断电,一般设备断电自身的蓄电池会坚持1-2分钟,争取将告警信息发给网管平台,
8、然后就会提示电源掉电告警。解决办法:恢复供电以后查询网管系统告警消除。,b ,电源模块发热无法正常工作,一般出现这种情况大部分是在夏天会出现,因为现场设备运行温度高,一般处理办法是让设备停止一会工作电源模块冷却后,通电恢复正常。但是这只是一种手段,毕竟我们到现场是要解决问题的,所以我们正确的做法是将设备的风扇打开就可以了,特别是远端机的的环境比较难以控制。解决办法:断开电源一会使模块冷却,或者将设备风扇打开。,c ,电源模块出现故障,这种情况的发生可能性很小,一般到现场以后,首先是判断设备自身是否断电,或者是电源模块无法正常工作,确认无误以后,检查电源模块是否已坏。解决办法:更换电源模块。,四
9、、收发信号告警,其实在所有直放站的告警当中,直放站收发信号告警是最棘手也是最难解决的。a ,底噪放或者是功放模块坏了,一般就会出现收发信号告警,一般收发信号告警在现场联机或者是检查都是很难找出原因的,都只有慢慢的检查各种和收发信号有关的模块或者是查看远端是否断电,但是断电导致收发信号告警的可能性很小,一旦远端断电就会出现光收发信号告警。解决办法:查找原因,持续观察,否则更换设备。,b ,设备出现误告警,一般收发信号告警的出现基本做法是将设备断电重启,或者是联机检查,如果都没有消除告警,那只有初步断定是误告警。解决办法:持续观察,否则更换设备。,五、上下行链路告警,上下行链路告警:远近段进行通信
10、的链路值不匹配。a ,上下行链路衰减值不匹配,只要上下行的衰减设置不匹配,超过了上下行链路设置的匹配值,就会提示上下行链路不匹配。解决办法:只要我们重新设置其衰减值达到匹配以后告警就会消除。,b ,光路故障,一般收发光出现故障的情况下也会出现上下行链路故障,怀疑是这种故障的情形下就只有进行光路测试和检查。解决办法:测试远近端的收光和发光值进行判断。c ,设备挂死,一般设备挂死以后远近端无法正常通信,无法进行链路连接,也会出现上下行链路告警。解决办法:重启设备后故障消除。,六、下行驻波比告警,下行驻波比告警:远端分布的驻波比超过设备设置的门限值就会出现告警。出现驻波比告警一般有以下几种可能:如、
11、分布馈线弯曲、馈头松动,分布有断点。由于分布自身的驻波比很高,超过了驻波比设置的门限值1.5。处理方法:首先联机查看其设置的驻波比门限是多少,若果设置的值是1.5以下,可以适当的修改其门限值大于1.5,,再查询是否有告警,如果仍存在,那么我们就只有用驻波比仪测试其分布的驻波比实际值是多少,如果驻波实在是很大甚至大于2,那么我们就得要求检查分布故障是否有断点或者是馈线浸水等等,只要分布实际的驻波消除,那么其驻波告警相应的就会消除。,七、底噪放模块故障,底噪放模块故障:一般底噪放模块告警就是近端机内部的底噪放模块无法正常工作,导致远端室分信号达不到正常的标准值。底噪放模块坏,一般我们到远端发现现场
12、无信号,或者是信号很弱,我们也有可能初步怀疑是上行底噪放模块出现故障。解决办法:更换底噪放模块。,日常故障处理的基本流程,1、接到故障告警后首先可以询问网管先查询告警是否属实,且是否还存在。2、如果告警消除,那么我们可以初步的判定是误告警。这里我们就得根据不同的误告警分析室什么原因造成的,是否晚上停电白天送电正常,毕竟网管的轮询都是设置在晚上12:00以后;是否是设备模块自身造成误告警等等都有可能,所以我们针对这些误告警要实施的跟踪和现场核实。,3、如果告警未消除,我们可以根据网管的告警或是无应答分别采取措施,如果告警,那表明通信正常,监控卡这一块是没有问题的,就得去现场核实,如果是无应答,我
13、们首先可以做的是拨打监控卡号码,看是否可以打通,如果可以打通那么我们要考虑是否远端断电或者是光路不通,得根据检验分析。,4、如果确定要去现场的,我们就得根据不同的告警判断是否需要去近端,如果要去近端我们就得提前借宏站钥匙,否则到现场需要检查近端的话就没有办法,所以这是一个基本的经验。,5、同时我们也得根据不同的告警,准备一些基本的仪表,如光功率计,驻波比仪,笔记本,调试线,各种对应厂商的模块,这都是根据不同的告警可以选择。,6、对于现场设备挂死需要重启恢复正常监控的设备我们要做好记录,且实时保持关注,对于告警平凡出现的设备我们也要实时的关注,不断总结,查找个厂商设备的运行特点,做到不到现场就可以判断出设备的故障的原因所在,为我们消除告警节省时间。,总 结,面对目前直放站的种类繁多,我们在处理告警之前,最关键也是最基本的是我们要掌握所有集成商的设备调试软件,否则到现场是无从下手的,所以我们在掌握更多技术和经验的同时也忽略了这些基本的策略。,