1、SPS基本维护操作 培训胶片,ISSUE 1.0,Page 2,课程内容,BAM服务器权限管理日志管理数据库管理批处理消息跟踪告警,Page 3,BAM服务器,BAM服务管理器及各进程运行状况:,Page 4,BAM服务器,BAM Manager界面列表项意义表 :,Page 5,BAM服务器,各进程启动类型设定 除Perfmon进程为“系统”外,其他进程要求设为“自动”(系统已默认,请勿随意修改),Page 6,BAM服务器,各进程的功能 :,Page 7,BAM服务器,进程实时监控功能 系统默认实时监控是打开的(请勿随意更改),Page 8,BAM服务器,SGBAMService 用于检测
2、BAM服务管理器(进程名为SecurityManager)的运行。当发现异常时,重新启动计算机。 SGSMirror 用于进行数据映像,将本机的数据文件拷贝到应急工作站,Page 9,权限管理,命令组管理:LST/ADD/RMV CCGG_SYS 系统管理员G_GUEST GUEST用户G_0G_4 为5个预置命令组 G_5G_63 用于自行定义的命令组 G_0G_4为5个预置命令组,分别为维护管理类、告警管理类、话统管理类、数据管理类、操作系统类。 可以对G_0G_4命令组重新定义包含的命令。也可以自定义G_5G_63命令组包含的范围。,Page 10,权限管理,用户管理:LST/ADD/R
3、MV OPSET OPCG 设置操作员权限命令组(可以选择G_0G_63)SET OPTM 设置操作员操作时限系统管理员有权增加、删除或修改普通操作员密码,但是不能删除自身和Guest帐号。 普通操作员在自己的操作时限内可使用自身权限范围内的命令。系统管理员和Guest帐号不受操作时限的限制。,Page 11,权限管理,工作站管理:LST/ADD/RMV WS 用于查询/增加/删除一个工作站SET WSCG 用于设置某个工作站权限命令组BAM上的客户端默认具有系统权限 工作站权限可以选择G_0G_63以及G_SYS和G_GUEST中的某个或某几个,最终工作站权限是所有这些选中的命令组中命令的合
4、集。 某用户在某工作站上操作时实际拥有的权限为登陆的用户权限和所用工作站权限的交集。,Page 12,日志管理,SPS日志管理提供了对命令行操作记录的查询功能可以查询的日志信息包括: (LST LOG)操作员使用的帐号 使用的工作站的IP地址 曾经执行过的命令 执行命令的日期和时间 返回结果,Page 13,日志管理,使用LST LOG可以查看到所有在BAM上运行过的命令,以及命令的执行情况:+ HW-SPS 2007-10-29 15:26:05 O,Page 14,日志管理,日志的保存: 在SPS命令行输入工具的主界面上,选择菜单操作/开始报告存盘,选择 保存路径和文件名。 日志容量设置:
5、 在默认路径D:SPS128BAM.ini 中修改 LogRight LogSpaceLimit = 120000 (默认日志容量,设置范围1000003000000)日志删除时限设置: SET LOGT (可以设置7365天),Page 15,数据库管理,默认数据库备份路径: E:MSSQLSGDATA 默认数据库命名: BamYYYYMMDD.dat 数据库备份方法: 自动备份 手动备份,Page 16,数据库管理,自动备份:每天凌晨04:30(缺省时间,可修改),系统会将BAM数据库和注册表自动备份到缺省目录(路径可修改)。BAM数据库的自动备份是滚动进行的,最多可以备份11个数据库的文
6、件: 保存从当天往前连续7天(星期天除外)的数据库备份 (BamYYYYMMDD.dat ) 保存前28天内4个星期天的数据库备份 (BamYYYYMMDD.dat ) 每月的第一天还保存了一个BAM数据库备份 (BamMonthBak.dat),Page 17,数据库管理,手动备份: BKP DB(推荐方式;可备份到网络路径中) SQL Server的Enterprise Manager中手动备份数据库,Page 18,数据库管理,一致性检查: ACT CNSCHK(比较BAM数据库与主机数据库的所有数据表信息 ) CMP TBL (具体比较某个数据表间的异同 )一致性恢复方法有: RST
7、DBTBL (以前台数据为准恢复后台BAM数据库) RST TBL (以主用HSYS板为准恢复其他单板数据) 设置软拨码后单板重新加载(以后台BAM数据库为准恢复前台数据),Page 19,批处理,批处理文件: 格式:脚本文件(纯文本文件 )批处理文件制作方式: 使用Notepad等编辑工具进行编辑 采用SPS命令行输入工具界面上“开始命令存盘”和“结束命令存盘”的方式,Page 20,批处理,采用SPS命令行输入工具界面上“开始命令存盘”和“结束命令存盘”的方式生成批处理文件:,Page 21,批处理,Page 22,消息跟踪,SPS支持的消息跟踪类型包括: MTP消息跟踪 SCCP消息跟踪
8、 SCCP用户消息跟踪 TCAP对话状态机跟踪 SCTP消息跟踪 M3UA信令消息跟踪 其他消息跟踪,Page 23,消息跟踪,MTP消息跟踪: 跟踪目标类型 消息类型 过滤条件 参数设置 消息存盘 (默认路径D:SPSTRACE),Page 24,消息跟踪,MTP消息跟踪窗口 :,Page 25,消息跟踪,SCCP消息跟踪: 消息类型 翻译结果类型 参数设置 存盘路径,Page 26,消息跟踪,SCCP消息跟踪窗口界面及参数。 可以双击选中的某条跟踪消息,系统会弹出消息的详细解释。,Page 27,消息跟踪,消息跟踪其他相关说明 :鼠标双击选中的消息,将弹出详细解释窗口。 可用空格键暂停/继
9、续跟踪。 对于UI图形化界面关闭跟踪窗口;SLPU/SHPU板复位都将关闭跟踪 。 严禁在业务忙的时间段内对链路进行长时间消息跟踪或进行大批量链路的消息跟踪 。,Page 28,告警,SPS告警台,Page 29,告警,SPS的告警也可以通过MML命令来查看(LST ALMLOG),Page 30,告警,MML查询告警示例:+ HW-SPS 2007-10-29 15:21:17 ALARM #6774010 %LST ALMLOG: ALMTP=FLT, ALVL=MAJOR-1, CNT=1000,CONFIRM=Y;% RETCODE = 0 执行成功ALARM 21072133 故障
10、重要告警 System 1107 软件告警 告警发生时间 = 2007-09-13 16:35:13告警名称 = 工作站恶意非法登录告警模块 = 其它模块告警子模块 = 定位信息 = 工作站IP=192.121.101.21其他描述信息 = 同一工作站连续登录三次以上不成功,就会出现该告警,具体登录信息请参看日志信息。修复建议 = 请检查为该工作站为什么连续登录不成功,Page 31,告警,禁止/激活告警的命令用于禁止或者激活指定SHPU/SLPU单板上的链路测试告警、物理错误告警和353告警。,Page 32,告警,告警库的备份,Page 33,常见告警,6号告警:链路发生故障 364383
11、1 链路发生故障 重要告警 2009-03-30 12:21:26 2009-03-30 12:29:15 6 软件告警 MTP MTP链路 链路索引=40 链路名称=IGW1-L0 原因=01 02 24 04 21 05 1401 故障-恢复 ATM 2M 链路告警原因如下:30:本端SSCOP检测到协议错误发起释放;31:SSCOP发起的释放过程(可能 NO_RESPONSE 超时);32:本地发起的释放过程(比如去活链路);33:远端层管理发起的释放;34:远端因为协议错误发起的释放;35:远端发起的释放(不明原因,所提取的SscopUU长度 != 4);36:远端发起的释放(对端 l
12、ayer3 下发了释放命令,比如对端去活链路);37:远端因为处理器故障发起的释放;38: SSCOP不能恢复发起的释放;39: 本端 TIMER_NC 超时发起的释放;3A:本地处理器故障发起的释放;3B:本端检测到过多的错误发起的释放。 检查链路发生故障的原因,告警原因码在告警参数中的“21 05“后面那个字节,其常见意义如下:05:由于MTP三层去活导致的链路中断,可能原因为人工去活或链路测试消息多次未正确返回;0F:本端检测出底层错误太多导致的链路中断 ;14:收到对端发来的SIO,SIOS导致的链路中断 ;19:收到错误的FIB导致的链路中断 ;1D:收到对端发来的SIPO导致的链路
13、中断;1E:收到对端发来的SIN或SIE导致的链路中断 ;22:拥塞时间过长导致的链路中断(T6超时);62: 证实过度延时导致的链路中断(T7超时);AB:表示链路断链原因请参考相应的MTP链路OUT_OF_SERVICE告警;AC:表示链路断链原因请参考相应的M2PA连接故障告警;如果参数全部为FE:表示收到COO或者ECO断链;如果参数全部为FF:表明该链路所在单板故障或者与HSYS通信中断;其中,除人工去活外其他故障如线路故障、对端故障或本端单板故障等必须处理。,Page 34,常见告警,2号告警:路由不可用 3581684 路由不可用 重要告警 2009-03-29 00:03:38
14、 2009-03-29 00:54:01 2 软件告警 MTP MTP路由 路由索引=3 路由名称=北京HSTP1_R00 故障-恢复 (1) 查询对应路由的状态,找出该路由不可达的原因,可能因为链路组发生故障、路由禁止传递或路由离线。(2) 根据路由故障原因按照对应故障的处理方法进行处理。,Page 35,常见告警,348号告警:对这种特定的地址未翻译 1554463 对这种特定的地址未翻译 次要告警 2009-03-31 16:12:33 348 运行告警 SCCP 类型=0x04 号码计划=0x01 类别=0x04 GT=0x861301079650f000 原因=0x62 消息=83
15、78 1d ff f5 45 ff0c 09 81 03 0e 18 0b 12 08 00 12 04 事件 告警记录如下:对这种特定的地址(类型:1XX,号码计划:2XX,类别:3XX,GT:4XX5XX6XX7XX8XX9XX10XX11XX)未翻译,原因:12XX,消息:13XX 14XX . 51XX 52XX ( 共四十个字节).4XX5XX6XX7XX8XX9XX10XX11XX: 表示未翻译成功的GT,最大含16个码,如果不足16个码,则以 F 为GT码结束标志;告警记录中四十字节的参数是翻译失败的消息,应根据SCCP的消息格式分析被叫地址,然后找出翻译失败的GT码。同时也要分
16、析出主叫地址,找出消息的起源局点及用户。引起这种故障的通常原因为本地漏做了某一GT 的数据. 但是, 如果拨错号,本地也会收到一错误的被叫 GT,这时也会报告此错误。 在收到这种告警时,处理如下:(1)分析被叫GT, 一定要将被叫 GT 分析完全;(2)确认该GT是否正确;(3)如果该GT为一错误的GT,可以不与理会;(4)如果该GT为一漏做的GT,请先确认该GT对应的翻译类型和GT翻译点,再将其添加到GT翻译表中;如果是本地的GT,还要将其对应的SSN添加到子系统表中。 0X62:收到的远端消息中被叫地址中的GT码类型错误或消息中被叫地址内的GT码在本地未配置; 0X67:处理出错返回消息时,主叫地址中的GT码类型错误或消息中被叫地址内的GT码在本地未配置; 0X65:本地用户消息中被叫地址内的GT码类型错误或本地用户消息中被叫地址内的GT码在本地未配置; 开发区LSTPA,