1、VoLTE集中分析方法及应用2目 录一 工作背景及成效二 VoLTE集中分析方法三 下一步工作思路3分析优化规则不完善端到端分析方法欠缺评估指标统计标准不统一VoLTE集中分析与优化存在的问题n 前期集中分析优化规则均为 LTE数据业务, VoLTE新增大量流程环节,分析优化规则需重新探索;n 端到端网元种类多,目前无相关分析定界规则;n 性能分析未有效结合信令关联分析。n 端到端流程长,涉及专业多,问题定位难。如 VoLTE接入失败,原因可能涉及无线网、EPC、传输、 IMS、增值业务平台等;n 各网元失败原因值不同,关联分析困难。如 eSRVCC切换基站侧统计主要失败原因为 7种,信令监测
2、为 10种,之间关系不统一,没有统一关联;n 单维分析不能精确定位问题。需建立多维数据的关联分析方法,提高问题定位精度。n 各系统节点统计差异大,如 eSRVCC切换成功率指标网优平台为 96.2%,信令监测为 94.1%, eMSC网元统计为 89.3%;n 部分用户原因导致的失败,仍然计入失败统计,浪费大量的资源去分析定位,指标统计需进一步规范。n VoLTE集中分析与优化目前主要面临 分析优化规则不完善、端到端分析方法欠缺、质量评估指标统计标准不统一 等问题。4VoLTE集中分析优化工作成效问题定位准确率高优化工作效率提升质量指标改善明显我省通过开展 VoLTE集中分析与优化工作,有效提
3、升了问题定位准确率和工单处理效率,网络质量得到明显改善。n 7-9月共产生 VoLTE工单 593张,运用集中分析方法准确定位问题493个,问题定位准确率达 83.14%。n 已定位无线问题的主要原因为 弱覆盖、干扰、故障 ,分别占36.27%、 23.44%、 13.64%。n 通过智能分析系统落地集中分析优化方法,平均每张工单处理时长较人工方式节省 30分钟 ,全省 7-9月工单集中分析共节省 50人天 ,后续随着系统不断完善和工单量增加,效益将更加明显。n 通过开展 VoLTE集中分析优化,各项关键指标较年初得到明显改善。 8月份 VoLTE接通率从 98.3%提升至 99.6%, Vo
4、LTE掉话率从 0.27%下降至 0.12%, eSRVCC切换成功率从 90.3%提升至 96.18%。数据来源:网优平台5目 录一 工作背景及成效二 VoLTE集中分析方法三 下一步工作思路 集中分析总体架构及方法 原因值分析定界法 语数协同关联定界法 增强八步定位法 多维指纹库定位法 集中优化方法综合应用6VoLTE集中分析架构及方法( 1/2)系统架构:分为采集层、数据存储层、应用层系统界面:多维呈现n 我省在原有的 LTE集中分析优化体系基础上,完善了 VoLTE集中分析与优化方法,其中新增功能模块 5个 ,改造功能模块 3个 ,已通过 智能专家分析系统 全面落地。无线侧数据网络侧数
5、据 其他数据应用层:集中分析LTE性能工单智能分析算法引擎数据存储层数据清洗数据适配采集层MRO/MRS DT/CQT/扫频数据 PM/NRM数据 告警数据XDR/CHRHadoop平台SQL Server数据库高价值密度结构化数据低价值密度半结构化、非结构化数据其他引擎八维度算法引擎 路测算法引擎 信令算法引擎 量化关联法引擎时间相关性引擎数据过滤 业务关联时间关联 空间关联Volte性能工单智能分析MR工单智能分析室分工单智能分析路测工单智能分析Volte路测工单智能分析干扰工单智能分析地理信息数据栅格场景数据问题属性库厂家 OMC数据网优平台 路测系统 厂家 OMC 信令系统 MR地图栅
6、格化系统系统互联( 1)性能评分( 2)问题表征( 3)问题原因( 4)分析模块( 5)分析元素( 6)关键 KPI展示( 7)多维度指标呈现( 8)多维度自查报告( 9)优化方案建议n采集层 系统互联: 打通不同平台的数据接口,与其他平台交互数据 多维数据解析: 对原始数据清洗、过滤等粗加工;完成隐私加密确保数据安全;n数据存储层 数据仓库: 完成数据汇总、问题原因和问题表征标准化; 算法引擎: 各维度算法模块化;n应用层 集中分析: 针对各种类型的工单进行集中分析,输出工单预处理方案建议。7针对 VoLTE网络特点,我省从 拓展发现手段 、 创新分析方法 、 完善分析规则 三个方面进行研究
7、,形成了一套 VoLTE集中分析优化方法,提升了 VoLTE集中分析效率与准确率 。性能实时性能非实时性能测试ATU测试商用终端测试掌上网优MRMRO/MRS/MRE VoLTE性能指标的原因值 VoLTE XDR信令 软采拓展数据源八步分析法干扰分析覆盖分析故障分析资源分析参数分析Counter分析邻区分析两两邻区对分析精准定位精准定位 八步量化关联分析:挖掘历史数据,量化具体权重 时间拟合关联分析:精准拟合影响根因 立体多维指纹库分析:多维数据关联,定位端到端问题精确定界精确定界 原因值分析定界法 语数协同关联定界法 终端、用户聚类分析定界方案输出方案执行效果评估规则完善创新分析方法拓展发
8、现手段 创新分析方法 完善分析规则系统自学习案例收集方案匹配规则梳理目前系统已实现580条规则梳理VoLTE集中分析架构及方法( 2/2)8精确定界:原因值分析定界法( 1/2)我省从无线入手,深入分析 VoLTE各类指标对应的无线失败原因值,总结问题根因,梳理处理规则,探索基于失败原因值的定界分析方法。定界分析思路n 针对 VoLTE接通率、掉话率、 eSRVCC切换成功率、重建、丢包 等 VoLTE关键指标各自对应失败原因值进行详细分析,研究各种失败原因值对应的 失败码或信令流程 ,定位问题原因,确定问题排查方法。n 针对 VoLTE 5个关键指标, 39个失败原因值形成了各原因值对应的分
9、析流程,梳理了 120多 条无线和端到端的分析规则,在集团指导下输出 VoLTE无线性能集中分析 指导手册。同时把规则在平台进行固化,提高问题定界准确性。规则梳理成果原因值梳理 基于原因值的信令分析 问题定界及排查规则 涵盖各厂家无线失败原因值及相应定义 失败码分析 信令流程分析 制定各具体失败原因值对应的排查方法9规则梳理举例n 如 eSRVCC切换失败主要有六大类原因,确定失败原因主要对应 3个关键信令节点,针对信令节点及错误代码分析故障可能的原因,最终确定问题的排查规则。以 “ LTE到 GSM的切换出准备失败次数,等待切换响应定时器超时 ” 为例:问题定界及规则梳理eSRVCC失败原因
10、 值LTE到 GSM的切换出准备失败次数,等待切换响应定时器超时LTE到 GSM的切换出准备失败次数,目标侧准备失败LTE到 GSM的切换出准备失败次数,其它原因LTE到 GSM的切换出执行失败次数,源侧发生重建立LTE到 GSM的切换出执行失败次数,等待 UE CONTEXT RELEASE消息超时LTE到 GSM的切换出执行失败次数,其他原因源侧发送 Handover Required后 在定时器时间内 未收到 Handover Command命令eNodeB定时器参数、 传输问题 、 MME、eMSC、 GSM侧参数配置错误 、 基站故障1. 核查 eNB参数 “ S1 HO时等待 HO
11、 COMMAND的定时器 ” 是否小于 5s。2. MME是否收到 Handover Requied消息: “ 否 ” ,则 核查 eNB与 MME之间的传输 ;3. MME是否向 eMSC进行 Ps to Cs Req消息转发 : “否 ” ,则 协调 MME共同进行排查 ;4. eMSC是否收到 Ps to Cs req消息 : “ 否 ” ,则 核查MME与 eMSC之间的传输 ;5. eMSC是否回复 Ps to Cs Rsp: “ 否 ” ,则 协调GSM侧共同进行排查 ;6. eMSC回复 Ps to Cs Rsp后 MME是否收到 : “ 否 ”,则 核查 MME与 eMSC之间
12、传输 ;7. MME是否向 eNB发送 Handover Command: “ 否” ,则 协调 MME共同进行排查 ;8. eNB是否收到 Handover Command: “ 否 ” ,则核查 eNB与 MME传输 。精确定界:原因值分析定界法( 2/2)问题定界及排查规则基于原因值的信令分析原因值梳理梳理 eSRVCC失败的各类原因值备注:信令 采样点 2/4/9即表示在定时器时间未收到响应消息。备注:中兴基站统计10p 目前部分 VoLTE指标的失败原因值存在定界指向不明确问题,分析总结经验数据发现: 如果为 无线原因 造成指标劣化,则 VoLTE业务与数据业务指标趋势 相关性较强
13、; 如果为 核心侧及终端原因 造成,则 VoLTE业务与数据业务指标趋势 相关性较弱 。p 目前系统已对 VoLTE接通率、掉话率、丢包率等指标实现了语数协同关联定界,准确率达到 95%以上 。p 针对部分定界不明确的原因值(如 “ E-RAB建立失败次数,其他原因 ( QCI=1) ” ),因无线、核心侧及终端均有可能存在问题,无法清晰定界。本方法对 VoLTE业务与数据业务在无线侧的相关性进行分析,挖掘无线指标的拟合趋势特征, 辅助 VoLTE原因值定界 。p 如下图所示,当 VoLTE与数据业务 相关性强 ,则 定界无线问题 (情形一);当 VoLTE与数据业务 相关性弱 ,则重点转入 核心侧及终端 排查(情形二) 。拟合分析:VoLTE与数据业务指标 相关性强情形一:重点转入排查 无线网问题( EPC以下) 情形二:重点转入排 查核心侧及终端问题语数协同关联定界思路精确定界 -语数协同关联定界法( 1/2)拟合分析:VoLTE与数据业务指标 相关性弱