1、HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 目 录i目 录第 1 章 故障处理的一般流程和常用方法 1-11.1 对维护人员的基本要求 1-11.2 故障处理的一般流程 1-21.2.1 信息收集 .1-21.2.2 故障判断 .1-31.2.3 故障定位 .1-41.2.4 排除故障 .1-51.3 故障判断与定位的常用方法 .1-51.3.1 原始信息分析 1-51.3.2 告警信息分析 1-51.3.3 指示灯状态分析 1-61.3.4 电话拨测辅助分析 .1-61.3.5 仪器、仪表辅助分析 .1-61.3.6 话务统计辅助分析 .1-61.3.7 信令跟
2、踪 .1-71.3.8 日志查询 .1-71.3.9 测试 /环回 1-71.3.10 对比/互换 1-81.3.11 联系华为客户服务中心 1-81.4 故障处理的基本步骤 1-9HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-1第 1 章 故障处理的一般流程和常用方法MSOFTX3000 作为移动网络中的控制层设备(MSC Server),其网络地位异常重要,在系统故障的情况下需要设备维护人员迅速定位并排除故障。1.1 对维护人员的基本要求MSOFTX3000 设备维护人员应接受华为公司相关培训,具备以下基本素质:1.
3、专业素质和技能维护人员应做到以下应知应会: 熟悉 PCM 原理、移动通信原理、软交换原理等通信专业知识。 熟悉 MSOFX3000 的功能结构、呼叫流程、业务流程等产品知识。 熟悉 No.7 信令、BICC 信令、DSS1 信令、H.248 等相关信令协议。 熟悉相关国标技术规范。 了解计费原理及流程。 了解以太网、TCP/IP、Client/Server、数据库常识等计算机网络基础知识。 熟练掌握 MSOFTX3000 日常操作及计算机基本操作。2. 对系统和组网的熟悉维护人员应熟悉本系统网络组网情况: 熟知 MSOFTX3000 的硬件结构及性能参数。 熟知 MSOFTX3000 各模块在
4、网络中的地位。 熟知 MSOFTX3000 各模块间及到各局所的路由组织。 熟知 MSOFTX3000 与各组网设备所使用的信令或协议。 熟悉相关的传输设备的网络结构和信道分配。3. 对设备的操作为了提高故障处理的效率,防止误操作,维护人员应持证上岗,并对MSOFTX3000 的相关操作流程应十分熟练,部分重大故障的处理建议由已经通过华为技术有限公司工程师培训级别以上的人员执行,除此之外,维护人员在对设备进行操作时,还应十分清楚以下内容:HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-2 哪些操作将导致部分或全部业务中断。
5、哪些操作将造成设备损坏。 哪些操作将对计费产生重大影响。 哪些操作将导致用户投诉。 有哪些应急或备份的措施。4. 对仪器、仪表的掌握仪器、仪表在 MSOFTX3000 的故障处理过程中有着不可替代的作用,它以直观、量化的数据直接反映故障的所在,在迅速进行故障定位、提高故障处理效率的过程中发挥着重要的作用。维护人员应熟练掌握下列仪器、仪表的使用: 万用表 七号信令分析仪1.2 故障处理的一般流程一般情况下,故障处理需经历以下四个阶段: 信息收集 故障判断 故障定位 排除故障1.2.1 信息收集1. 必要性任何一个故障的处理过程都是从维护人员获得故障信息开始,这种故障信息的来源一般有四种途径: 用
6、户或客户中心的故障申告 相邻局所维护人员的故障通告 OMC 告警系统的告警输出 日常维护或巡检中所发现的异常在 MSOFTX3000 系统的日常维护中,前三种途径所提供的故障信息量占绝大多数,但是,在很多情况下,特别是故障信息通过电话反馈时,我们所获取的第一故障信息对故障现象的描述往往是不完整的、不全面的,也是不深刻的,通常不能直接反映问题的本质所在。HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-3随着网络规模的扩大,MSC Server 的组网情况也日趋复杂,各种内、外部因素的变化和干扰常常对 MSOFTX3000 的正
7、常运行产生连带影响,使 MSOFTX3000 的故障成因日趋复杂,同时也增加了故障定位的难度。如果仅仅依靠简单的信息来分析、判断问题,而忽视进一步收集各种相关的原始信息,往往事倍功半甚至寸步难行,它不但使故障判断的范围扩大、难度增加,而且还有可能在分析思路上南辕北辙,以致贻误故障处理时机,给 MSOFTX3000 的稳定、安全运行带来严重威胁。2. 实用性尽管 MSC Server 许多故障现象的成因十分复杂,但是,从统计学上分析,各种因素同时作用并导致 MSC Server 发生故障的概率是很小的,也就是说,导致 MSC Server 故障的成因在某一具体时刻具有单一性。这就使利用排除法迅速
8、定位故障成为可能。如果在故障处理的初期阶段,就注重收集各种相关的原始信息,很多情况下,它可以帮助维护人员大大缩小故障判断的范围,加快定位问题的速度,并提高故障定位的准确性,这对于提高故障处理的时效性,降低设备误操作的风险,以及提高客户满意度等方面都具有积极的意义。3. 维护建议 维护人员要有收集相关信息的强烈意识,在遇有故障特别是重大故障时,一定要先弄清楚相关情况后再决定下一步的工作,切忌盲目处理。 维护人员要加强业务学习,特别是系统原理和信令知识,这样,在故障的情况下才能快速联想,把思路引向问题的焦点。 在接听故障申告(通告)电话时,维护人员要善于引导,尽量从多方面、多角度提问或询问相关问题
9、。 维护人员应加强横向、纵向的业务联系,建立与其他局所或相关业务部门(如传输机房等)维护人员的良好业务关系,这对于信息交流、技术求助等都是很有帮助的。1.2.2 故障判断在获取故障信息以后,接下来需要对故障现象有一个大致的定义确定故障的范围与种类,这也就是说,需要判断故障发生在哪个范围,是属于哪一类、何种性质的问题。HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-41. 确定故障的范围确定故障的范围就是确定故障处理的方向,也就是说在什么地方、顺着什么思路去查找故障的具体原因。在 MSC Server 系统中,故障的范围一般是
10、指故障发生的区域,它往往与 MSC Server 的功能模块重合,这是由 MSC Server 的模块化设计所决定的。本手册将主要以 MSC Server 的业务和功能模块划分来判定故障的范围,划分如下:按业务划分:(1) 基本电信业务的故障分析与定位(2) 智能业务的故障的分析与定位(3) 补充业务的故障分析与定位按功能子系统划分:(1) 控制系统的故障分析与定位(2) 时钟系统的故障分析与定位(3) 信令系统的故障分析与定位(4) 计费系统的故障分析与定位(5) 操作维护系统的故障分析与定位2. 确定故障的种类确定故障的种类(性质)就是确定采用何种方法、何种手段分析问题、解决问题。关于故障
11、的分类,将根据 MSC Server 不同的业务流程和功能模块,按照通常的思维逻辑采取不同的分类方法进行,具体的情况请见本手册后续各章节的讨论。1.2.3 故障定位前面提到,尽管导致 MSC Server 故障的成因可能十分复杂,但是在统计上和实践上,某一时刻多种因素同时作用导致 MSC Server 故障的概率是很小的,也就是说,故障的成因在某一具体时刻具有单一性。故障定位就是“从众多可能原因中找出这个单一原因”的过程,它通过一定的方法或手段分析、比较各种可能的故障成因,不断排除非可能因素,最终确定故障发生的具体原因。准确而快速的定位不仅有利于提高故障处理的效率,而且还可以有效避免因盲目操作
12、设备而导致故障扩大化等人为事故,为采取何种手段或措施排除故障提供指导和参考,是故障处理过程中的重要环节。本章将在下节简要介绍“故障判断与定位的常用方法”。HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-51.2.4 排除故障在故障原因最终定位以后,就进入了故障处理程序的最后一步排除故障。排除故障是指采取适当的措施或步骤清除故障、恢复系统的过程。如检修线路、更换单板、修改配置数据、倒换系统、复位单板等。1.3 故障判断与定位的常用方法1.3.1 原始信息分析原始信息是指通过用户故障申告、其他局所故障通告、维护中所发现的异常等所
13、反映出来的故障信息,以及维护人员在故障初期通过各种渠道和方法收集到的其他相关信息的总和,是进行故障判断与分析的重要原始资料。原始信息分析主要用来判断故障的范围、确定故障的种类,在故障处理的初期阶段,为缩小故障判断范围、初步定位问题提供判据。如果维护经验丰富,甚至还可以直接定位故障。原始信息分析不仅可以用在用户故障的处理上,在其他故障特别是中继故障的处理上,由于需要与传输系统对接以及存在信令配合的问题,原始信息的收集就更具有举足轻重的作用。比如,传输系统运行是否正常、对端局是否改动过数据、某些信令参数的定义等。1.3.2 告警信息分析告警信息是指 MSC Server 告警系统输出的信息,通常以
14、声音、灯光、屏幕输出等形式提供给维护人员,具有简单、明了的特点,其中告警维护台输出的告警信息,包含故障或异常现象的具体描述、可能的发生原因、有哪些修复建议等等,涉及硬件、链路、中继、计费、CPU 负荷等 MSC Server 的各个方面,信息量大且全,是进行故障分析和定位的重要依据之一。告警信息分析主要用于查找故障的具体部位或原因,由于 MSOFTX3000 告警台输出的告警信息丰富、全面,因此常常可以用来直接定位故障的原因,或配合其他方法共同定位故障的原因,是故障分析的主要手段之一。MSOFTX3000 告警有着很高的故障定位精度,如对于信令系统能测试定位到每一条电路。如果告警台出现多条告警
15、时,可以根据告警级别优先处理告警级别高的故障告警,最后处理事件告警。HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-61.3.3 指示灯状态分析MSOFTX3000 的每块单板上都有相应的运行、状态指示灯,有的还有功能或特性指示灯,这些指示灯除了直接反映相应单板的工作状况以外,大部分还可反映诸如链路、光路、节点、通道、主备用等的工作状态,是进行故障分析和定位的重要依据之一。指示灯状态分析主要用于快速查找大致的故障部位或原因,为下一步的处理提供思路。由于指示灯所包含的信息量相对不足,因此,它常常与告警信息分析配合使用。1.3.
16、4 电话拨测辅助分析在 MSC Server 所提供的所有业务中,语音占很大部分,因此,与 MSC Server 有关的大部分故障原因,往往会直接或间接地影响到用户的正常呼叫功能,因此,利用电话拨测这一最直接的方法来判断 MSC Server 的呼叫处理功能和相关模块是否正常,是一种简单、快捷的方法。电话拨测是日常维护最常用的手段之一,它常与用户接口跟踪配合使用,在检测交换系统的各种功能上(如呼叫处理、主叫号码显示、计费等)有着广泛的应用。1.3.5 仪器、仪表辅助分析应用仪器、仪表进行故障分析与定位,是 MSC Server 故障处理常用的技术手段。它以直观、量化的数据直接反映故障的本质,在
17、信令分析、误码检测等方面有着广泛的应用。1.3.6 话务统计辅助分析接通率是程控 MSC Server 的一个重要技术指标,它直接影响到运营商的经济效益和客户服务满意度,是电信运营商核心竞争力的要素之一,因此,提高接通率并降低呼损,是运营商普遍关注的重要内容。但是,影响 MSC Server 接通率的因素纷繁复杂,而且偶然性大,难以有效地加以预测。因此,提高接通率的关键就在于要能够及时地找出引起呼损的主要因素并加以有效地防范,话务统计就是这样一个有力的分析工具。话务统计分析常常与信令跟踪、信令分析等配合使用,在查找局间信令配合异常、中继参数设置错误等方面有着重要的作用,维护人员应牢牢掌握此方法
18、的应用。HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-71.3.7 信令跟踪信令跟踪在分析用户呼叫接续、局间信令配合等过程的失败原因方面有着重要的应用。利用跟踪的结果,常常可以直接得到呼叫失败的原因,找出问题的症结所在,或者从中得到启发,为后续分析提供宝贵的思路。MSOFTX3000 提供了丰富的信令跟踪手段,主要包括 7 号信令链路跟踪、用户接口跟踪、接口跟踪、接续跟踪、用户跟踪等跟踪手段。用户接口跟踪主要用于已知故障用户的用户号码情况下的信令跟踪,但对于本局用户的用户接口跟踪必须满足VLR 中存在该用户数据的条件。7
19、号信令链路跟踪主要用于分析非特定用户的接续故障以及 MTP 信令的信令分析。接口跟踪主要用于 MAP 和 CAP 信令配合的故障定位。对于中国一号的信令故障主要使用接续跟踪。用户跟踪主要分析造成本局移动用户通话故障的内部原因值。1.3.8 日志查询由于 MSC Server 数据配置的复杂性,经常出现由于数据配置考虑不周而引发故障的情况。为了尽快定位这种类型的故障,就需要查询维护人员在 BAM 上进行的数据配置的操作。MSOFTX3000 提供的日志查询命令为“LST LOG”。通过此命令可以查询在指定时间段内维护人员使用了哪些命令更改数据,然后再通过对这些命令的分析,定位故障。除了查询本局的
20、日志信息外,对于和对局有关的问题,还应询问对局做了哪些数据更改。1.3.9 测试/ 环回测试主要是指借助于仪器仪表、软件测试工具等手段,对可能处于故障状态的用户线路、传输信道、中继设备等进行相关技术参数的测量,根据测量的结果判断设备是否已经故障或者正处于故障的边缘。MSOFTX3000 软件本身提供对中继电路和资源通道的指定测试,通过此方法可以使特定呼叫强制占用某一电路或资源通道,避免了为了要占用某条电路或资源通道而闭塞其他电路或资源通道。该方法主要用于对中继电路和资源通道问题的故障定位,比如测试是否有中继电路单通的情况。环回主要是指采用硬件或软件的方法,对某一传输设备或传输信道采取自发自收(
21、自环)的方法,通过判断自环后传输设备、传输信道、业务状况、信令配合等情况的正常与否,来确定相关硬件设备的状况、软件参数的设置是否正常,是定位传输问题、中继参数设置是否准确等的最常用方法之一。在定位与传输有关的故障时,测试与环回常常配合使用,相得益彰。环回有软件环回与硬件环回之分,软件环回操作简单,使用灵活,但可靠性不如硬件环回。另外,在新开局和中继扩容过程中,MSC Server 中继自环也常常用于判断本局中继参数设置是否正确、出局路由数据设置是否正确等方面。HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-8注意:软件环回有
22、时由于疏忽往往容易忘记取消环回,从而 给 MSC Server 的运行带来一定的操作隐患,因此,为了避免此类事件的发生,我们建议维护人员应养成经常记录的习惯。1.3.10 对比/互换对比是指将故障的部件或现象与正常的部件或现象进行比较分析,查出不同点,从而找出问题的所在,一般适用于故障范围单一的场合。互换是指用备件进行更换操作后,仍然不能确定故障的范围或部位,此时将处于正常状态的部件(如单板、光纤等)与可能故障的部件对调,比较对调后二者运行状况的变化,以此判断故障的范围或部位。注意: 互换单板操作风险较大,且容易引入新问题,建议互换只局限在光纤、E1 等部件上。 在进行更换或互换单板时,一定要
23、在话务量很低的时候进行。1.3.11 联系华为客户服务中心如果您在日常维护或故障处理过程中遇到有难以确定或难以解决的问题的时候,或者通过本手册的指导仍然感觉没有把握,您可以通过电话、传真或电子邮件联系联系华为公司客户服务中心,我们将为您提供周到的技术支持服务,同时,您在向华为公司客户服务中心反馈问题的时候,请您注意提供或收集以下信息: 交换局点的详细名称(全称) 联系人姓名、电话号码 故障发生的具体时间 故障现象的详细描述 MSOFTX3000 的主机软件版本 故障后已采取的措施和结果 问题的级别及希望解决的时间华为公司将安排相关人员进行跟踪处理。HUAWEI MSOFTX3000 移动软交换
24、中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-91.4 故障处理的基本步骤当出现故障时,尤其是用户申告的业务故障时,应尽可能的收集故障的各种原始信息(以用户通话故障为例,需要了解是主叫故障、被叫故障还是上网故障、故障出现的时间、故障出现的地点、用户的归属地、用户登记了哪些补充业务、用户手机的情况等信息)。如果故障出现时伴随有相关的告警,尤其是故障告警时,应首先进行告警信息分析。维护人员根据原始信息以及告警信息(如果有告警信息)的分析结果,对故障的类型进行大致的判断。当判断故障为业务故障时,则根据故障的业务类型参照本手册相应业务故障处理的描述,综合使用日志查询、信令跟踪
25、、业务拨测等故障定位方法进行处理。当判断故障为功能子系统故障时,则根据故障功能子系统的类型(主控、时钟、中继、信令、计费、操作维护系统)的故障,参照手册相应功能子系统章节的描述,综合使用日志查询、测试/环回、对比/ 互换等多种手段进行故障定位。如果故障不能尽快解决,请迅速联系华为公司客户服务中心,在相关人员的指导下定位并解决故障。本手册详细介绍了各种业务故障和功能子系统故障的具体方法,维护人员在处理时可以根据手册相应内容,遵照 图 1-1 所示的基本步骤进行故障解决。HUAWEI MSOFTX3000 移动软交换中心 维护手册故障处理分册 第 1 章 故障处理的一般流程和常用方法1-10原 始
26、 信 息 分 析检 查 故 障 出现 时 是 否 有 相 应 的告 警 产 生 ?N 告 警 信 息 分 析Y告 警 消 除 后 , 故障 是 否 存 在 ?Y结 束N故 障 判 断利 用 信 令 跟 踪 和 电 话 拨测 、 对 比 等 手 段 进 行 故障 定 位故 障 是 否 解 决 ?联 系 华 为 客 服 中 心N结 束 Y查 询 日 志 或 直 接 查 询 相关 的 数 据 配 置近 期 修 改 的 数 据 是否 正 确 ?业 务 故 障 Y功 能 子 系 统故 障故 障 与 数 据 配 置有 关查 询 日 志 或 直 接 查 询 相关 的 数 据 配 置Y近 期 修 改 的 数 据是 否 正 确 ?利 用 测 试 /环 回 、 对 比 /互 换 等 手 段 针 对 不 同 的功 能 模 块 进 行 故 障 定 位NYN数 据 修 改 后 ,障 是 否 存 在 ?Y修 改 错 误 数 据结 束N 数 据 修 改后 , 故 障 是 否存 在 ?修 改 错 误 数 据结 束NNY图 1-1 故障处理的基本步骤