1、基于无线通信网络的智能化专家运维系统研究随着移动无线网络的不断发展,传统的人工方式已完全无法适应庞大的运维需求,智能化运维方法的研究迫在眉睫。本文设计了一种智能化的无线专家运维系统,并对该系统在移动无线网络中的日常维护应用进行了详细阐述。智能化专家运维系统的应用将极大地降低人力运维成本,提高运维效率,具有极强的可推广性。 【关键词】专家运维 智能定位 智能分析 随着移动网络的不断发展,组网日益复杂,网络设备种类日益繁多,承载的业务量也越来越大。随之而来的是维护任务的加重和保护级别的提高,依靠纯人工的方式已完全无法满足运维需求。因此,移动无线设备的集中化、智能化运维管理研究迫在眉睫。 移动网络的
2、庞大复杂使得由设备故障引起的用户侧影响概率大增,如何快速准确地定位故障成了衡量运维工作质量的重要标准之一。同时,移动网络维护人员常常忙于大量常规告警的监控及处理,且受限技能水平,往往无法及时地分析网元的各种隐患,也无法将问题消除在萌芽状态。大量的人为因素和人力瓶颈导致了无线网络的故障时间较长,业务恢复较慢,整体服务质量偏低。因此本文研究的智能专家运维系统将以故障的智能分析和定位作为突破口,为无线通信网络的日常运维提供更多的辅助决策和支撑手段。 1 系统工作原理设计 面临移动无线网络维护和性能提升带来的诸多问题,本文基于BSC智能预警分析与性能提升,设计了一套智能化的专家运维系统。无线专家运维系
3、统通过接入网管数据库、BSC设备、以及traffic实时跟踪设备,全方位的获取告警、CPU LOG、Clear Code(释放码)、负荷、状态、KPI、配置数据等信息,系统根据预先设定好的阈值执行决策树,即将专家对某一种故障的处理思路按照流程图的方式进行程序设计来实现,对收集的信息进行全方位综合分析判断,及时排除网络隐患与故障,并给出相关解决建议、方案。系统还集成了网元健康检查、升级指导等功能,同时实现了无线资源的集中智能化管理。 系统主要实现了三大模块七部分功能,主要为智能分析定位、无线资源集中智能化管理、网络安全保障等。无线专家运维系统原理图如图1所示。 从图1可以看出,本文设计的无线专家
4、运维系统通过三类接口全方位获取网络数据,完成综合分析。通过决策树原理实现网络及设备隐患的自动预判,故障的智能定位,并提供解决方案。同时集成了网元健康检查、KPI深度剖析等功能,并实现了无线资源的集中智能化管理,能够大幅提高运维效率,缩短故障处理时间,也解决了现网中跨专业的运维难题。 2 系统功能设计 无线专家运维系统的功能框图如图2所示。 2.1 网络实时监控功能 该功能实现全方位监控,涵盖所有关键信息:告警、CPU LOG、Clear Code、负荷、状态、KPI、配置数据等,系统对收集的数据进行综合分析判断,及时发现网络的隐患与故障,侧重于发掘影响设备安全的隐性故障以及影响用户感知的KPI
5、问题。具体功能主要包括:告警管理,告警监控;释放码管理,释放码监控;实时业务指标管理,实时业务指标监控;负荷管理,负荷监控;状态管理,状态监控。其中,告警监控是实时接收网管推送,释放码指标、实时业务指标和性能负荷指标是以5分钟为周期,可以及时的发现并预警问题。系统资源状态监控周期是1天。 同时,用户可以个性化设置通知方式,包括对紧急故障、严重故障、一般故障、网络性能故障等每一种故障的是否通知、通知方式、通知的手机和邮件、通知的时间进行设置。 2.2 隐患自动预警与故障智能定位分析功能 系统通过对网元的实时指标、资源配置监控和KPI深度剖析,捕获网络故障,发现故障后在第一时间通知相关人员,同时收
6、集网元的日志,通过故障定位分析,初步判断故障源及发生原因,并给出故障解决的指导意见。日志和指导意见都可以作为故障解决的参考。 其中,对故障定位的范围可以包括软件故障、硬件故障、单元故障、总线故障、时钟故障、接口故障。分析结果包括故障描述、故障级别、影响范围、预分析结论和恢复建议。 2.3 无线性能深度剖析功能 包括KPI问题的智能关联与剖析,以及网元系统资源分析两部分内容: 2.3.1 KPI问题的智能关联与剖析 系统监控日常重要的KPI,并对异常小区的KPI进行分析。对KPI问题的分析包括:分析配置数据、分析告警、分析clear code、分析CPU LOG、深入分析各种KPI、KPI问题的
7、定位、定位到网元(BSC/BTS/空口/MSC/SGSN)、定位到链路(S7信令,LAPD)、定位到PIU(MCMU/BCSU/AS7/PCU)、定位到传输(PCM)、定位到TRX/TSL(SDCCH)或内部电路。 2.3.2 网元系统资源分析 主要包括:设备配置的负荷均衡,A接口MTP信令链路负荷分担检查分析,A接口话务信道TC ET在BCSU之间的配置检查分析,ET、MTP、LAPD信令链路在BCSU之间的配置检查分析,TCH、SDCCH和BCCH信道在BCSU之间的配置检查分析,检查Gb接口NSVC的容量及均衡配置检查/NVLI检查分析,检查PCU所控制的BTS数是否满足规范及均衡配置检
8、查分析,检查PCU所控制的TRX数是否满足规范及均衡配置检查分析,检查PCU在无线接口上PDCH信道是否满足规范及均衡配置检查分析 检查EDAP配置是否满足规范及均衡检查分析,资源配置负荷及合理性统计分析(每天),硬盘容量检查分析,LICENCE容量与使用情况检查分析,MB和CPU单元的负荷检查分析,A接口信令链路负荷检查分析(FR/HR/AMR FRHR),A接口话路负荷检查分析,检查BSC忙时无线话务量及其设计容量检查分析。 2.4 知识库功能 知识库维护包括:设备软硬件版本升级指导、释放码库、告警库、Technical Note库、通用操作库、ECC/ESS案例库、NED、DX erro
9、r表。这些具体内容将作为通过决策树对故障进行智能定位的基础。 2.5 集成智能健康检查功能 健康检查是保证网络正常运行的工作之一。通过平台可以更加快速,准确的控制网元运行状态,对设备进行多项目全身体检。检查隐患、提前预防解决,保证设备长期安全稳定运行,可以通过并行、串行等方式实现。如:网元硬件配置、网元软件配置、数据参数配置、 网元运行状态。 2.6 告警客户端 系统能提供类似QQ的客户端,能以弹出窗口、声音、闪动等方式提醒用户告警出现,并在告警内容中链接到决策树,查看决策树处理流程,还可查看历史提示信息。 2.7 半速率工单处理 在BSC中经常需要进行新站的增加或者载频话务容量的调整(即半速
10、率的开启或关闭),系统能对BSC中所有正在使用的License的总数量和已用数量进行自动统计,如果License已经用完,系统就会预先作出提示,使维护人员能及时增加所需要的License,避免在进行新站增加或载频话务容量调整时出现License数量不够的状况。 另外,当维护人员接到半速率工单时,需要在网元侧及多台网管数据库查询是否可以操作。本系统可直接导入表格进行查询,并给出是否可以操作及不可操作的原因。 3 技术特点 本文系统通过智能化、深层次的分析及优化服务实现对所有BSC设备的隐患自动预警与分析、故障自动分析与定位、无线性能深度剖析,从而实现网元整体运行安全与性能的提升。具体技术特点如下
11、: 3.1 全天候值守 本系统套件部署在BSC及数据处理平台上,24小时监控告警、CPU LOG、Clear Code、负荷、状态、KPI、配置数据等关键信息。BSC静态数据、动态性能、业务指标及异常故障都在监控范围内,实现了对BSC的全天候主动值守。 3.2 隐患自动预警 网络隐患或多或少的存在于各个移动网络中,如果不能及时发现,软硬件环境一旦达到阀值,隐患就会演变为技术故障,影响网络性能及网络安全,严重时将导致业务故障。本系统定时收集告警、log、配置、参数、性通、KPI、资源、网管信息等,综合分析网络关联数据,结合知识库查找网络隐患。一旦发现存在风险或隐患,系统会自动发出短信、邮件通知指
12、定的运维人员,为解除隐患争取时间窗口。通过隐患查找及预警功能,推动运维模式由传统的被动式响应向“主动预防”转变,致力于将隐患消除在萌芽状态,减少故障发生,提高网络可用性。隐患自动预警功能效果示意图如图3所示。 3.3 智能故障定位 传统的故障修复需要经历几个必要环节:故障报修、接入网络并采集数据、故障诊断、制定方案、实施方案、验证与观察。本系统工具在监控到故障后,自动触发“智能故障定位”机制,保留现场数据,自动采集指定信息,根据特征码自动调用决策树,结合知识库分析,筛选案例信息,提供解决方案供参考。这些过程由系统自动判断、完成,不需要人工干预。智能故障定位的工作流程图如图4所示。 3.4 在线
13、资源分析 系统工具以按指定的频度对BSC软硬件进行在线分析,资源总量、门限设置、阀值设定、静态参数配置、动态负荷变化等诸多资源管理手段需要一致、合理,才能发挥最大的功效。任何一个环节的疏漏都可能导致“木桶短板效应”,在线资源分析功能通过建模、数理趋势化分析,定期进行在线资源分析,对资源短板、资源调整提出专家建议。该功能对于重大事件通信保障前期资源评估,重大事件通信保障期间的资源使用及负荷等具有重大指导意义。 3.5 健康检查自动化实现 为保证设备安全稳定运行,我们要每年进行两次全网大规模健康项目检查,而BSC设备数量大,健康检查项目繁多,需要庞大的人力和物力来支撑,给网络维护带来的巨大压力。智
14、能提升系统可同时对全网BSC网元实现并行自动检查,从而节约了时间,节省了大量人力和物力。 3.6 新的告警智能化监控模式 智能预警平台实时接收告警,并且通过告警客户端通知相关人员,同时系统会根据故障定位流程对异常进行初步的判断和分析,给出故障范围、可能的原因和处理建议,并且在第一时间收集相关的日志信息提供给维护人员,这样就可以大幅度的提高故障发现和处理的时间。 4 性能对比 移动综合监控平台对BSC维护来说基本上用到的只是监控告警,但监控告警功能有时并不能及时显示告警,或显示不全,并且需要借助HIT和EXCEL到现网中提取整理,相对应的提取数据和告警的macro经常出现中途停止和延时,影响对故
15、障的及时查询处理,这种情况下使用两个软件加大了维护人员的工作量和力度。智能预警平台实时接收告警,并且通过告警客户端通知相关人员,同时系统会根据故障定位流程对异常进行初步的判断和分析,给出故障范围、可能的原因和处理建议,并且在第一时间收集相关的日志信息提供给维护人员参考,这样就可以大幅度的减少对故障的发现和处理时间。 通过对以上两个平台进行实验对比,在时间方面综合监控平台得时刻监控,而借助的HIT软件每半小时或一小时循环一次,得到的数据并查询需30分钟,人工分析告警是否需处理要用10分钟左右。按每天8小时工作制计算,每一小时循环一次,人工耗时80分钟,且是每位包机人员必须做的重复性工作,在资源和
16、效率方面显得并不合理。BSC预警分析平台可随时提取现网告警,在后台进行初步的分析判断,并以闪烁窗口的方式提醒维护人员,节约了得到数据的时间,而通过后台的分析,人工再分析告警大概只用5分钟,节省了一半时间。 此外,系统可以自动同步完成对全网网元的巡检;系统的监控和故障定位分析功能也可以大大减少网络维护人员的工作量,提高工作效率;同时,系统通过程序实现对指标的计算,减少人为操作带来的误差,提高网络监控的准确率;而且通过对关键的KPI指标和系统资源负荷的监控可以对网络可能出现的问题进行提前预警,在对业务有所影响前发现隐患,及时补救,避免用户投诉的发生。 5 总结 本文从无线专家运维系统的工作原理出发
17、,对无线专家运维系统在日常维护应用方面进行了详细的阐述。同时,文章分模板描述了系统的主要功能,对比了常规运维及系统运维的效率。通过本文系统的实际应用,证明了系统设计的有效性,为移动无线通信网络的智能化运维提供了强有力的技术支撑。 参考文献 1尤力,高西奇.大规模MIMO无线通信关键技术J.中兴通讯技术,2014,02:26-28+40. 2刘芳华.基于ARM的WiFi无线通信终端的研究与实现D.武汉科技大学,2010. 3张晓蓉.通信网络管理系统的研究与应用D.西安电子科技大学,2007. 4王孙名,唐红,沈建国.新一代宽带无线移动通信网络管理的研究J.通信技术,2007,12:201-202
18、+205. 5宋鑫,郑刚,朱登科.高速铁路宽带通信网络管理系统管理模式研究J.计算机工程与设计,2013,08:2641-2645+2674. 6韩树宝.基于分层分域的战术通信网络管理架构的设计与实现D.电子科技大学,2014. 作者简介 李锐(1979-),女,河南省开封市人。大学本科学历。现为中国移动通信集团河南有限公司工程师,从事移动网络管理及无线通信主设备运维工作。 作者单位 中国移动通信集团河南有限公司 河南省郑州市 450046 文档资料:基于无线通信网络的智能化专家运维系统研究 完整下载 完整阅读 全文下载 全文阅读 免费阅读及下载阅读相关文档:AndroidNFC手机支付的实现
19、与应用 互联网+购票平台研究 物联网技术在灭火救援中的应用探讨 粉丝经济时代的社群营销 浅谈“养真课堂”教学模式的研究 基于Big6的大学生信息素养教学研究 信息化环境下中职英语“翻转课堂”实施策略研究 全球化背景下小学教育的发展 广东省中等职业教育规模与经济增长关系的实证研究 如何提高高校青年教师教学能力 高中毕业生心理健康问题与对策 常态体育课,规范为先 关于高职学生网络安全教育的思考与建议 马铃薯松散型胚性愈伤组织的诱导 浅谈小数教学学生自主学习的指导策略 中考英语复习备考的实践与体会 提高初中数学课堂教学效益的策略 地感谢你的阅读和下载*资源、信息来源于网络。本文若侵犯了您的权益,请留言或者发站内信息。我将尽快删除。*