1、运营平台服务监控软件需求规格(文档版本号:V0.2)拟 制: 夏颖强 日 期: 2008-6-23审 核: 日 期:会 签: 日 期:批 准: 日 期:深圳融创天下科技发展有限公司版权所有 不得复制文档编号 密级产品/项目名称产品型号深圳市融创天下科技发展有限公司产品代号运营平台服务监控软件需求规格仅供内部使用 1修订记录日 期 修订版本 描 述 作 者2008-6-23 0.1 初稿 夏颖强2008-6-26 0.2 增加节目单扫描需求 夏颖强运营平台服务监控软件需求规格仅供内部使用 2目 录1 范围 .32 引用标准 .33 符号和缩略语 .34 分析背景 .35 分析约束 .46 业务特
2、性分析 .47 业务应用场景分析 .48 业务分解 .49 业务设计要点 .510 业务设计点 list.511 附录 .9运营平台服务监控软件需求规格仅供内部使用 31 范围本文主要描述了运营平台服务监控软件(简称 SMT)的需求功能,并不对实现方式作出定义。2 引用标准3 符号和缩略语缩写 含义SMT Service Monitor Tool 运营平台服务监控工具4 分析背景针对广东运营平台出现的问题,以及随着上海移动运营系统上线,整个流媒体平台所面临的风险越来越大,对于运维的要求也越来越高。因此,需要一个监控软件来帮助运维人员主动及时地发现运营平台故障,并且能为优化运营平台积累相关数据。
3、运营平台服务监控软件需求规格仅供内部使用 45 分析约束6 业务特性分析SMT 的原型是 PC 版本的播放器,在此基础上,开发与运营平台监控相关功能;如,同时监控多个直播频道,故障监测和告警,用户登录服务监测等。因为广东移动和上海移动的运营平台的流服务器版本是不同的,SMT 需针对两个运营平台开发两套版本。7 业务应用场景分析运维工程师在日常维护工作中,通过 SMT 可以监控直播、点播、用户登录服务是否正常,如果有故障,SMT 会自动告警,提醒运维工程师及时排除故障。8 业务分解SMT 主要分为以下几大需求功能:1、 配置管理(编号 OR_01)主要是服务器地址、直播频道号等基本配置。2、 直
4、播频道监控(编号 OR_02)a) 目的是检测直播频道是否正常,针对的是如以前出现过的连接流服务器失败,直播源中断等故障。b) 主要功能有直播频道监控方式配置,直播频道播放显示,故障自动告警,如连接服务器失败、直播频道不存在等故障。3、 点播节目检测(编号 OR_03)a) 目的是检测点播节目是否正常,针对的是如以前出现过的点播文件未装载等故障。b) 主要是通过点播测试文件,发现点播节目的故障,并能自动告警。4、 用户登录服务监控(编号 OR_04)a) 目的是检测用户登录服务是否正常,针对的是如以前出现过 Oracle 数据库停止导致用户无法登录等故障。运营平台服务监控软件需求规格仅供内部使
5、用 5b) 主要是通过模拟客户端发起登录流程,定时检测登录服务是否正常。5、 RBS 负载均衡监测(编号 OR_05)a) 目的是检测 RBS 负载均衡是否正常,如象以前出现的域名无法解析(未交域名费等原因)等问题也可以检测。b) 主要是通过模拟客户端发起域名解析请求,来判断 RBS 负载均衡是否正常,并能统计调度结果。6、 节目单扫描(编号 OR_06)a) 目的是检测节目单是否存在死链接,及检查直播点播地址是否有错误,点播文件是否有问题等故障。b) 主要是通过逐级扫描节目单中的链接地址,遍历所有的直播和点播节目,以此来发现故障,并自动产生告警。c) 注:该需求实现后,可以替代“点播节目检测
6、(编号 OR_03) ”。9 业务设计要点见 10 业务设计点 list10 业务设计点 list需求 ID 功能需求 需求分解描述 备注OR_01 监控软件配置管理 OR_01_01 RBS 地址及域名配置 OR_01_02 直播流服务器 IP 和 PORT 配置,及保存流服务器列表 OR_01_03 直播频道配置,并保存直播频道列表 OR_01_04 WBSC 服务器 IP 和 PORT 配置 OR_02 流服务器直播频道监控 OR_02_01 配置同时显示的监控直播频道数,分别是1、2、4、9,同时监控的直播频道显示在直播频道监控窗口中,并均匀分布。OR_02_02 配置每个频道监控的时
7、间,从向服务器发送请求开始计时,计时结束后切换到下一个等待监控的频道。运营平台服务监控软件需求规格仅供内部使用 6OR_02_03 检测直播监控频道队列排列方式有:1、按流服务器顺序;2、按频道顺序;两种方式可配置。例如,有 2 个流服务器 A、B,3 个直播频道 1、2、3:1、按流服务器顺序的队列为:(A,1),(B,1),(A,2),(B,2),(A,3),(B,3),(A,1),(B,1)此顺序目的:是要把各个服务器上的所有频道都遍历一遍,保证每个流服务器上的所有频道都是正常的;缺点:是遍历一遍频道时间比较长,不利于及时发现直播源出问题;2、按频道顺序的队列为:(A,1),(B,2),
8、(A,3),(B,1),(A,2),(B,3)此顺序目的:是要把所有直播频道都快速检查一遍;缺点:不能及时发现推到单个流服务器上的所有频道是否都正常。OR_02_04 每个监控频道的界面显示信息包括:1、直播视频图像;2、音量柱实时显示音量大小变化;3、实际码率;4、分辨率;5、帧率;6、流服务器地址;7、频道号OR_02_05 在监控显示界面上,选择一个正在监控的频道,即播放该频道的声音。 OR_02_06 故障告警,需检测的故障类型有:1、连接服务器失败;2、直播频道不存在;3、图像中断(a、蓝屏视频源断;b、图像不再刷新无视频数据);4、无声音(无音频数据);5、音量增益超出预设范围(音
9、量偏大或偏小);告警阀值设置:1、图像中断检测时间,默认值 60 秒,即 60秒图像无变化,或没有图像数据,即告警;2、音量增益范围最大值和最小值;告警提示方式:1、屏幕告警文字信息提示;2、声光告警:a、告警频道闪烁红色告警灯;b、播放告警提示音;3、向监控人员发送短信,或拨打电话(须配置号码列表)OR_02_07 故障告警写入告警日志,并可查询到日志信息 运营平台服务监控软件需求规格仅供内部使用 7OR_03 点播节目检测 OR_03_01 配置点播测试节目路径,测试节目只有一个 OR_03_02 配置每次检测的间隔时间,及启动检测开关 OR_03_03 点播节目检测方式为:根据流服务器列
10、表上的流服务器,进行轮询;两次检测之间的间隔时间即为“每次检测的间隔时间”OR_03_04 故障告警,需检测的故障类型有:1、连接服务器失败;2、点播文件不存在;3、无视音频数据;告警提示方式:1、弹出告警信息提示对话框;(点播节目检测是没有单独播放界面,因此,有告警需要弹出对话框)2、声光告警:a、告警频道闪烁红色告警灯;b、播放告警提示音;3、向监控人员发送短信,或拨打电话OR_03_05 故障告警写入告警日志,并可查询到日志信息 OR_03_06 在状态栏显示点播节目检测状态信息:如“检测流服务器 0.0.0.0,点播文件test.mp4点播正常”OR_04 用户登录服务监控 OR_04
11、_01 配置用户参数,如电话号码、渠道、版本,具体定义与WBSC 接口规范中对客户端发起登录消息定义一致;保存配置为 XML 文件。 OR_04_02 配置用户登录服务监控间隔时间,及启动监控开关。 OR_04_03 配置登录超时时间,默认 15 秒,超时即认为登录失败 OR_04_04 故障告警,需检测的故障类型有:1、用户登录超时失败;故障提示方式:1、弹出告警信息提示对话框;2、声光告警:a、告警频道闪烁红色告警灯;b、播放告警提示音;3、向监控人员发送短信,或拨打电话OR_04_05 故障告警写入告警日志,并可查询到日志信 运营平台服务监控软件需求规格仅供内部使用 8息OR_04_06
12、 在状态栏显示用户登录服务监控状态信息:如“正在登录服务器 0.0.0.0。成功 N 次,失败 M 次,共 X 次”OR_05 RBS 负载均衡监测 OR_05_01 配置检测间隔时间,及启动检测开关 OR_05_02 配置域名解析请求超时时间,默认 15 秒,超时及认为域名解析请求响应失败 OR_05_03 故障告警,需检测的故障类型有:1、域名解析失败;故障提示方式:1、弹出告警信息提示对话框;2、声光告警:a、告警频道闪烁红色告警灯;b、播放告警提示音;3、向监控人员发送短信,或拨打电话OR_05_04 故障告警写入告警日志,并可查询到日志信息 OR_05_05 统计分析:1、分时段统计
13、,返回各流服务器 IP 地址次数和所占总次数百分比;2、统计域名解析请求响应成功次数,失败次数,及总次数。OR_06 不同流服务器版本支持 OR_06_01 支持广东运营平台流服务器版本 OR_06_02 支持上海移动运营平台流服务器版本(带计费鉴权,防盗链功能) OR_07 节目单扫描 OR_07_01 配置 EPG 服务器地址 OR_07_02 配置节目单扫描任务,参数:1、起始时间;2、结束时间;3、重复周期:a、无;b、每天;c、每周一二三四五六日(多选)4、每个视频节目监测间隔时间OR_07_03 根据配置的参数对节目单逐级扫描,对每个视频链接地址(包括直播和点播),进行连接并播放;
14、在遍历完一遍后,重新开始。运营平台服务监控软件需求规格仅供内部使用 9OR_07_04 故障告警,需检测的故障类型有:1、连接失败;2、播放对象不存在;3、无视音频数据;4、点播文件错误(视频文件有问题,不能完整播放完,如播放中途退出);5、视频链接地址格式错误;告警提示方式:1、弹出告警信息提示对话框;2、声光告警:a、告警频道闪烁红色告警灯;b、播放告警提示音;3、向监控人员发送短信,或拨打电话OR_07_05 故障告警写入告警日志,并可查询到日志信息 OR_07_06 在状态栏显示节目单扫描状态信息:如“正在检查 tmss:/0.0.0.0/1.mp4点播正常” 注:红色的字“向监控人员发送短信,或拨打电话”告警提示方式根据实现技术难度,考虑是否实现。11 附录对文档中的部分内容进行补充说明的附件