1、目 录一问题描述 21 无线链路超时 22 T3103 超时(除BSS内切换): 33 系统故障 .3二故障研究 41 覆盖盲区 .42 干扰 .43 切换问题 .5三解决措施 51 覆盖盲区 .52 干扰 .621 上行链路的干扰检测与消除 .622 下行链路的干扰检测和消除 .723 直放站干扰 83 硬件故障和系统问题 .8四实际案例 91 排障部分 .911 杭钢第三扇区(HZB535_2) .912 临安洪岭(HZB518_0) .102 覆盖调整 .1021 四季青蔬菜公司(HZB319_2) 1022 农都农贸公司第三扇区( HZB238_2) 103 参数分析和建议 .1131
2、 上行无线链路超时定时器 rlf1、rlf2 1132 最小接入电平MinAccess 1133 上行一步到位功率控制 1234 上行功率控制窗 .134 干扰问题 .1341 电务段-2掉话与邻频碰撞 1342 云中山庄(HZM293): 145 系统问题或其它的人为问题 .1551 杭州下沙三扇区 .1552 桐庐交通大厦 15五总结 16掉话分析专题掉话是指通话过程中的信道非正常释放。无线通信中由于无线信号在空间传播中受周围环境影响较大,加上运动过程中信号传播路径的改变,掉话可以说是不可避免的,这是与有线通信的一大区别。在日常维护和优化中掉话率是一项很重要的系统指标,降低掉话率也是维护和
3、优化过程中的一项重要工作。通常掉话有 3 个主要原因: 无线链路失败 (北电系统中的无线链路超时) 切换计时 T3103超时,除 BSS内切换 其它系统故障一问题描述1 无线链路超时移动台不能发出 SACCH(测量报告消息),或者在规定时间内没有被网络(BTS)解码,也无法执行其它切换,当 Radio Link Timeout 减为 0 时,信道就被释放,这就是无线链路超时掉话。在网络运行中,这种类型的掉话是最多的。计数器 C1164/13 和 C1164/14 统计由于无线接口失败和无线链路失败所引起的连接失败。 (2) 当 激 活 Abis Spy 时 (1) 已 建 立 专 用 信 道
4、(TCH or SDCCH) MSC BSC BTS MS MEASUREMENT REPORT MEASUREMENT RESULT . (2) (3) CONNECTION FAILURE CLEAR REQ (Radio Interface Failure) (3 ) 未 检 测 到 SACCH块 , 无 线 链 路 超 时 (1) 2 T3103 超时 (除 BSS内切换 ):当 BSC 将 HandoverCommand 信息发送到 BTS 时,BSC 启动计时器T3103。在 BSC 收到来自切换目标小区的 Handovercomplete 或者来自源小区的HandoverFail
5、ure 时将 T3103 复位,若 T3103 到时而 BSC 仍未收到任一种消息时,BSC 就判断在源小区发生了无线链路失败,进而释放源小区的信道并记录为一次掉话。计数器 C1164/24 是用来统计 T3103 超时的次数的,因此它可以反映切换由于 T3103 超时而造成的掉话数量。3 系统故障掉话也有可能是由系统故障引起。如由于操作维护的原因造成的掉话,和BSSMAP 定时器不匹配造成的掉话,以及传输不稳定所引起的掉话,但是这些原因与无线接口没有直接的相关性,涉及到 BSS 和 NSS 之间的配合问题。因此我们通常只研究那些直接影响无线接口质量的因素,如无线链路超时和T3103 超时。
6、UAReset T3103MSCBSCBTS2BTS1MSHandover IndicationChannel ActivateChannel Activate AckHandover Command Set T3103Handover CommandHandover Access Handover detectionPhysical Info (TA)SABM Establish IndicationHandover complete Handover completeHO performedHandover FailureHandover FailureHO Failure综合上述掉话原因
7、,通常计算每小区掉话的具体公式为:Tch Drop =c1164/8+c1164/13+ c1164/14+ c1164/15+ c1164/24+ c1164/25(com_rel_ts_rem_eqt + com_rel_rad_itf + com_rel_rad_lf +com_rel_t3103 + com_rel_t8 + com_rel_rel_ind_bts)二故障研究良好的维护可预防和解决绝大多数掉话问题,特别是高掉话小区(例如 8%以上) ,应首先检查是否有设备故障。这包括天馈线故障、基站收发通路设备故障、传输设备故障等原因引起的掉话,对于硬件问题可以通过一些告警消息来发现问
8、题。在排除了系统因素后才应考虑无线原因。通常掉话有以下一些原因:1 覆盖盲区覆盖盲区可有几种原因: 真正没有信号覆盖的地方,比如因基站太少导致覆盖不连续; 另一种是切换不及时。在一些信号会迅速减弱的地方(隧道,门厅,地铁.),如果切换反应速度过慢,可能在通话还未接入新的信道之前,原来的信道已经衰落到无法正常解码信令,从而导致掉话; 覆盖空洞也可能是由于某个小区出现了问题 (例如因设备故障造成小区瘫痪); 覆盖空洞还可能是由于丢失邻小区定义或定义不全,此时,系统会保持通话在现有小区中,直到超出该小区覆盖边缘而掉话。2 干扰干扰有来自内部 (网络造成), 和外部其它系统交调造成(GSM, AMPS
9、, TACS,),包括同邻频干扰、跳频干扰、直放站干扰等。当网络中存在干扰时,BTS 和 MS 由于误码率高而不能解出 SACCH 内容,导致无线链路超时,从而中断通话。干扰对切换也有负面影响,因为下行链路误码率高,移动台就无法解出 BTS发出的切换请求命令。在由 T3103 超时引起的掉话在 OMC-R 中有记录(C1164/24) 。为了确认小区干扰, 可以检查统计项 “Average Level of Nondecoded RACH” (反映上行链路干扰),“Ratio of HO on UL Quality ”(反映上行链路高误码率) 和“Ratio of HO on DL Quali
10、ty ”(反映下行链路高误码率)以及 C5000 (反映空闲信道的干扰电平)。3 切换问题切换问题包括邻小区表问题、邻小区阻塞问题、切换速度问题、切换参数设置问题。 邻小区表问题主要是指漏做或错误的邻小区关系导致边界的MS无处切换,产生掉话的问题,这种情况通过工程中对邻小区的检查核对应可避免。 邻小区阻塞是指由于邻小区阻塞,MS无法切换或是切换到较差选择的邻小区,由于信号电平较低或干扰,导致切换掉话,可通过降低主要邻小区的阻塞的方法来解决。 切换速度问题分为过慢和过快的切换。过低的切换速度会导致射频丢失,过快的切换速度会导致切换失败甚至是切换掉话,可通过调整相应的数据库参数来解决; 数据库中某
11、些参数的设置错误也会导致非正常的掉话,例如过低的lRxlevULH,过短的T3103等,解决方法是设置合适的参数。三解决措施1 覆盖盲区 如果确认是覆盖不连续造成的掉话,应考虑增设基站或室内微蜂窝。显然这已超出日常优化的工作范围,但这类信息对网络规划极有价值。 如果掉话率突然上升并且本站工作正常,检查相邻小区此时是否工作。 检查在OMC 数据库中定义的相邻小区是否互为对称关系,是否邻小区表定义不全。 通过路测以及Call Path Trace 来检查是否确有覆盖空洞存在。 检查是否存在特殊原因:隧道, 大型建筑入口 (商业中心等), 地铁入口,大斜坡 (和汽车速度,一天中的交通流量有关,一般来
12、说,掉话多集中于一段时间和某个方向)。最好的解决办法是先检查地图,听取工程人员和无线工程师建议,并进行现场勘察。 利用路测检测邻小区丢失的情况。进一步作Abis接口测试或呼叫路径跟踪,对找到问题很有帮助,需注意从测量结果中分析连接失败前的时间提前量(TA)以发现孤岛效应。2 干扰2 1 上行链路的干扰 检测与消除显而易见,上行干扰是由移动台造成的,因此上行干扰是和话务量大小紧密相关的。通过分析未正常解码的 RACH 突发的平均信号电平(Average Level of Nondecoded RACH),与因上行信号质量恶化而触发切换的比率(Ratio of HO on UL Quality)随
13、系统话务量的变化幅度,可以确定上行干扰是来自系统内或系统外。另一个对分析上行干扰非常有用的计数器是 Interf. Level on idle TS。当一个时隙处于空闲状态下,BTS 会依照一定的周期间隔对该时隙进行信号强度测试,对于理想情况下在该时隙下测量到的信号接收电平应该低于或等于-110 dBm。但由于频率复用的原因,总会测到超出理想情况的信号电平值。对空闲时隙的测试是以 SACCH 信息块为周期进行的(480 ms ) 。通过观测该计数器的变化,也可以分析干扰是来自系统内还是来自系统外,Avg Level Of Non decoded RACH&Ratio of HO on RxQu
14、al UL是否随网络话务量的变化有明显的变化否是系统外的上行干扰系统内的上行干扰分析方法如下图所示:通过分集接收和有效的功率控制以及不连续发射(DTX)等技术可有效地降低系统的干扰电平,从而减少上行干扰。另外,当基站接收通路上存在硬件故障时,也会出现大量的上行质量/电平切换,利用 Call Path Trace 可以查看小区的链路平衡情况来进行判断,再检查相应的接收通路上的硬件故障, 通过测量 VSWR, 检查基站接收部分的工作状态(包括 Receiver,RxSplitter,LNA 等) 。2 2 下行链路的干扰检测 和消除下行干扰主要是由于频率规划不当而造成部分基站的同频干扰和邻频干扰,
15、从话务统计数据上看,下行干扰一般会引起频繁的下行切换,通过测量报告和现场路测可判断是否存在同邻频干扰,对无上述情况但有干扰的小区可用频谱分析仪来寻找干扰源。排除下行干扰的方法有: 调整邻频干扰源小区和故障小区的天线俯仰角,以减小他们的重叠区域; 如果天线的俯仰角已经属于偏大,此时不宜再调整天线俯仰角,否则天线的方向将会有较大的畸变。在保证上、下行链路基本平衡的前提下,可以适当减小干扰源基站的发射功率。针对站高50米的小区,应特别注意,否则及易造成 “灯下暗”的现象; 如果由于各种条件的限制,邻频干扰不能通过减小服务小区和干扰源小区的重叠面积消除时,就只能进行频率分配方案的调整; 对于同频干扰,
16、则必须进行频率分配方案的调整。-85 dBm-95 dBm-100 dBmInterf. Level on idle TS可能的原因: 外来干扰 硬件故障正常 可能的原因: 系统内的上行干扰 外来干扰通过比较高话务和低话务该指标的变化来确定干扰是来自系统外或系统内另外,在采用跳频的地方,如果话务量比较大,跳频负荷比较大,因此也会出现较大程度的同邻频干扰,而由于跳频系统的伪随机性,若想定量地判断干扰源较为困难,这时可采用“替代法” (用一个干净的频点替换跳频序列中的频点)来寻找干扰源。2 3 直放站干扰为了减少投资,扩大覆盖范围,一些郊区或小范围内的覆盖常常通过采用直放站将基站的上下行信号直接放
17、大,用光纤或微波传输来进行解决。当采用室外直放站时,一般采用采用微波传输的办法,因此直放站在将所需基站的上下行信号直接放大的通式,也会将干扰信号放大,从而引起信号质量的下降,最终导致掉话。这时需要厂家对直放站的上下行通路重新进行调整。在安装直放站的同时,还必须根据其相邻小区的定义情况来查看其实际的周围小区情况,尤其要关注它是否会与其周围小区互相造成干扰,这时常常造成切换掉话和干扰掉话。在出现以上情况时,应及时重新进行频率规划,并修改邻小区表,调整切换参数和功率控制参数。3 硬件故障和系统问题对因硬件原因而产生的掉话,可通过 OMCR 查看相关硬件的告警。一般来说,当帧处理单元出现故障时,分配失
18、败率和上下行质量切换都会比较严重;当接收部分出现故障时,分配失败率和上行质量切换会较严重,当发射部分出现故障时,分配失败率和下行质量切换会比较严重。这时可用功率计、信号发生仪等设备检查相应的硬件,并更换损坏了的硬件。由于天馈线驻波比过大、天线浸水、天线方位角或俯仰角不正确等导致的掉话可通过检查天线驻波比,馈线接口有无松脱、不符合规范等措施来解决。定期进行 BTS 时钟校准、传输同步检查和传输质量检查,保障稳定的传输质量,可以减少许多 ABIS 掉话。四实际案例杭州联通 7、8 月份忙时系统掉话率(不含切换)基本在 0.96%左右,忙时话务量在 6000 爱尔兰左右。开展集中优化后,我们对全网掉
19、话排名靠前的一些比较恶劣的小区采用TOP20 法进行了分析排障,取得了很大的进展,目前全网没有忙时掉话次数超过 20 次的小区,但同时这也给下一阶段的掉话处理带来了困难。在对北电功率控制、切换控制等参数深入研究后,我们将全网个别 BSC 的功率控制、切换控制进行了参数调整,也有了很大程度的改善。目前杭州联通忙时系统掉话率(不含切换)基本稳定在 0.9%左右,忙时话务量稳定在 6500 爱尔兰左右。下面是我们针对掉话率所采取的一些主要手段以及相应的一些典型案例:1 排障部分由设备故障原因引起的掉话现象通常会比较明显,同时分配失败率、切换失败率等其他指标也会比较恶劣,因此当某小区的掉话次数突然增加
20、,首先应该怀疑是否是设备故障引起的。1 1 杭钢第三扇区( HZB535_2)杭钢是七期刚开通的基站,其第三扇区自开通以来就存在着分配失败率高的问题。我们通过 callpathtrace 分析得出:该扇区上行电平非常差,在-80dbm以下,link balance 达到 30 以上,因此怀疑是接收通路有问题。经过现场检查,发现是外包工程队在开通基站时,将 Rx splitter 线连错,从而导致上行接收链路出现问题。将连线重新连接后,问题解决,指标恢复正常。Call drop ratio (Cell) *0.00%1.00%2.00%3.00%4.00%5.00%6.00%7.00%8月2日8
21、月3日8月4日8月5日8月6日8月7日8月8日1 2 临安洪岭( HZB518_0)该扇区分配失败率高达 45%,掉话率及掉话次数也比较高,因此怀疑是硬件故障(特别是载频部分) 。在将该扇区第一块载频锁住后,指标一切正常。2 覆盖调整当手机进入覆盖盲区时,很容易引起射频掉话,而基站过覆盖所引起的干扰、孤岛效应等也会造成掉话。因此根据实地测试调整基站覆盖范围也是项很重要的工作,对降低掉话率也很有帮助。2 1 四季青蔬菜公司( HZB319_2)该扇区掉话率较高,经过话务分析发现,主要是射频掉话较多。通过callpathtrace 和实地 DT 测试,发现 TA 较大(局部达到 7) ,覆盖较远,
22、因此怀疑掉话是由于局部地区过覆盖而导致部分边缘地区信号迅速下降而引起的。我们将该扇区天线倾角压低两度后,对该站覆盖范围进行控制后,掉话率有所下降。2 2 农都农贸公司第三扇区( HZB238_2)在对农都农贸公司第三扇区进行天线调整后(天线倾角从 6 度压到 10 度) ,其覆盖范围得到了有效地控制,因此掉话率也有所下降,达到了调整的目的。Call drop ratio0.50%0.60%0.70%0.80%0.90%1.00%1.10%1.20%1.30%8月2日8月3日8月4日8月5日8月6日8月7日8月8日3 参数分析和建议3 1 上行无线链路超时定时器 rlf1、 rlf2下行无线链路
23、超时定时器 rlf1 赋以一定初值,当基站无法正确解码一个测量报告后,该定时器减 1;当基站正确解码一个测量报告后该定时器加 2(但不能超过初值) ,一旦该定时器减为 0 则判断为一次上行射频掉话。rlf2 用来设定rlf1 的增量。因此 rlf2 的设置使系统对掉话判定的影响较大。1修改部分高射频掉话小区 rlf1 的值 78:基站号 基站名 基站号 基站名HZB099_2 杭师范大学 HZB188_2 晨光实业HZB212_1 大关南苑 HZB018_2 杭州东冠2针对近期射频掉话较高的小区,rlf2 作了修改(24):基站号 基站名 基站号 基站名HZB182_2 杭州联庄 HZB014
24、_2 北城饭店HZB099_2 杭师范大学 HZB188_2 晨光实业HZB214_1 景芳五区 HZB315_2 顺流泵业公司HZB337_0 金星大酒店 HZB030_2 德胜新村HZB013_0 禽蛋 HZB332_0 杭州棉毛针织厂HZB281_1 杭州宋城3 2 最小接入电平 MinAccess我们将 BSC24 的 MinAccess 由-104 改为-100,控制手机接入范围,以抑制覆盖边界区的掉话。修改后掉话率有了一定程度的下降:minACCESS与 掉 话 率 的 关 系0.90%1.11%1.32%1.52%9-3 9-4 9-5 9-8 9-9 9-109-119-129
25、-139-159-16220230240250260270280290300310TCH话 务 量 bsc 24 掉 话 率 趋 势 线3 3 上行一步到位功率控制由于目前掉话率指标的忙时(19:00:0.94%左右)和闲时( 10:00:0.8%左右)的差别较大,可以认为由于话务量原因,高话务时手机的干扰增大尤其是上行干扰会特别明显。因此我们将北电的上行增强型一步到位功率控制功能(enhenced one shot power control)在个别 BSC 的所有小区上打开,以期达到尽量减小上行干扰的目的。从修改后的掉话率话务统计看,这几个 BSC 的掉话率均有较明显的改善,趋势图如下:E
26、nhanced one shot0.900%1.000%1.100%1.200%1.300%1.400%1.500%1.600%1.700%1.800%1.900%2002年 9月 16日 2002年 9月 17日 2002年 9月 18日 2002年 9月 19日bsc 7 bsc 16 bsc 19 bsc 23 4 上行功率控制窗北电系统约定,如果要采用一步到位功率控制功能,上行功率控制窗的下限必须在-85dBm 左右,因此我们将以上 BSC 所有小区的 lRxlevULP 设为-85-84dBm;uRxlevULP 设为-75-74dBm 。4 干扰问题由于联通 GSM900M 的频点
27、资源比较紧张,因此在路测过程中我们发现由于同邻频干扰所引起的掉话和话音质量差等现象出现的也比较多,另外杭州联通采用的是 1X3 跳频,当话务量大时,跳频负荷增加,也会产生很大的干扰。4 1 电务段 -2掉话与邻频碰撞问题描述:手机占用电务段_2(BCCH117 )时,与梅花碑 _1(BCCH116 )产生严重的邻频碰撞,话音质量为 7 级,最终导致掉话。见下图:图 3.10 电务段-2 覆盖图图 3.11 电务段-2 解码图将梅花碑_1 (HZB087_0) 的天线电调角由 8 度10 度后,问题得到解决。4 2 云中山庄( HZM293):该站为室外微蜂窝,掉话率为 20%左右,并且 Non
28、DecRACH 电平为-90dbm,分配失败率为 6.3%,对云中山庄做 call path trace 测试,发现 RF link balance 在-10dbm 左右,并且上行质量比较差。由此可看出该微蜂窝处所受上行干扰严重,初步怀疑是微蜂窝的上行通路存在故障或是由于外部干扰引起。我们对云中山庄微蜂窝的硬件部分进行了检查,没有发现问题。但在现场我们发现该微蜂窝处还安装了一个 G 网直放站和一个 C 网直放站,进一步怀疑是由于该 G 网直放站引起的上行干扰导致云中山庄的指标恶化。关掉该直放站后,观察 call path trace 测试结果,发现 RF link balance 在0dbm
29、左右,并且上行质量也比较好。从话务统计中看,该站指标也已经正常。5 系统问题或其它的人为问题5 1 杭州下沙三扇区从开始优化以来,该扇区的掉话是我们感到最棘手的问题,通过了很多手段(改频、改邻区、基站硬件检查、调整天线倾角方位角、调整掉话参数、外干扰测试等等) ,但一直均无法有效的解决。从掉话的现象和实际测试看,除了系统外干扰外,我们还推测了该小区用户行为造成的可能。对此我们进行了分析和了解,发现正对着基站方向的 MOTOROLA 公司手机生产线的测试号码为紧急呼叫号 112(该号的呼叫次数和时长无法从记费话单中体现) ,并且测试时不排除直接掉电的可能,造成对掉话率指标恶劣的人为影响。在我们关
30、闭了该基站所在交换机的紧急呼叫功能后,下沙三扇区的掉话率指标立刻恢复正常,与我们推测的情况完全符合。目前该扇区(900/1800 )全天单时段最高掉话不超过 10 次。掉话次数的趋势图如下(9 月 18 日以后恢复正常):下 沙 三 扇 区 掉 话 次 数 趋 势 图0204060801001208-14 8-22 8-26 9-1 9-2 9-5 9-7 9-8 9-9 9-11 9-16 9-17 9-18 9-19900 18005 2 桐庐交通大厦在前阶段的优化中我们发现桐庐交通大厦的掉话率指标在一天中的波动极异常,高时每小时曾达到 100 次左右,尤其在系统忙时。曾经怀疑有外干扰,但
31、经实地测试后均无异常。另外由于该基站天线较高(50 米左右) ,且俯仰角较大,不可避免的造成较远的覆盖产生对掉话不定的因素。因此我们对该小区进行了以下分析和调整:将该站机调天线更换成电调天线,并压低天线倾角,控制其覆盖,并试图降低其话务量(调整前为 15Erl 左右、目前为 10Erls 左右) ;从该小区的 TCH 跳频组分析发现,由于话务量的原因使载频的配置较大(4 个载频) ,3 个跳频载频的跳频组分配为:97、100、103、106、110、111,当话务量升高时会不可避免产生较高的自身频率碰撞可能(110 和 111) ,导致系统性能下降。我们删除了跳频组中的频点 111,并为保证较
32、低的跳频负载在话务量下降的情况下关闭了其中一块载频。修改的掉话统计情况看,桐庐交通大厦三扇区的瞬时高掉话情况已经解决,忙时掉话最多不超过 10 次(基本上在 0-3 次) ,而且目前还没有产生话务阻塞。五总结综合以上原因分析和解决方法,我们总结出以下的掉话处理思路:高掉话小区硬件维修传输检查OMCR 话务统计工具、DT 测试、信令分析仪检查小区参数切换参数跳频参数功率控制参数邻小区参数覆盖 干扰 切换RXLEV 均值检查TA 值检查DT 测试call path trace 测试切换原因统计RXQUAL均值统计频谱分析仪检查直放站切换原因统计、与各邻小区的切换成功率无法确定功率调整天线调整增加基站限制 TA频点调整BSIC 调整覆盖调整检查邻小区故障检查邻小区定义检查切换参数检查硬件信令追踪参数修改排除外部及系统问题