1、,数据挖掘技术在 电信用户分析与保持中的应用,北大2013公安班数据挖掘第13小组 2013年11月,北大2013公安班数据挖掘第13小组 成员名单,黄锡锋:1301220570 张 佶:1301220690 赵 征:1301220706 徐 良:1301220670 周 健:1301220713 张 峰:1301220686,电信运营商之间竞争激烈,两 有:市场占有率,用户保有量 ARPU:每用户月平均收入,提升,电信运营商之间竞争激烈,运营商的年ARPU值,ARPU值逐年下降,应努力调整业务结构以适应形势变化。,电信运营商之间竞争激烈,运营商年ARPU值,留住一个用户所需要的成本是争取一个
2、新用户成本的1/5,相关分析主要分析变量之间联系的密切程度;回归分析主要基于观测数据与建立变量之间适当的依赖关系。相关分析与回归分析均反映的是数据变量之间的有价值的关联或相关联系,因此两者又可统称为关联分析。,(一)相关分析和回归分析,时间序列分析与关联分析相似,其目的也是为了挖掘数据之间的内在联系,但不同之处在于时间序列分析侧重于数据在时间先后上的因果关系,这点与关联分析中的平行关系分析有所不同。,(二)时间序列分析,分类与预测用于提取描述重要数据类的模型,并运用该模型判断新的观测值分类或者预测未来的数据趋势。,(三)分类与预测分析,聚类分析就是将数据对象按照一定的特征组成多个类或者簇,在同
3、一个簇的对象之间有较高的相似度,而不同的簇之间差异则要大很多。在过程上看,聚类分析一定程度上是分类与预测的逆过程。,(四)聚类分析,从实际情况上看,国内电信企业每月的用户流失率一般在1%3%左右,如果直接采用某种模型(比如决策树、人工神经网络等)可能会因为数据概率太小而导致模型的失效,因此我们需要加大流失用户在总样本中的比例,但是这种过度抽样必须谨慎小心,要充分考虑它的负面效应。,(一)抽样,在实际运用的过程中,可能存在用户被判断具备流失倾向,但当数据返回到用户服务前台的时候用户已经流失的情况,其原因可能存在于不同业务部门之间协调工作的时延过长或者数据采集间隔太长等,这使得流失判定预警丧失了原
4、有的意义。,(二)模型的有效性,数据挖掘在用户流失管理中的重要应用不仅仅应包括对用户流失的提前预警,还应包括用户流失后的原因分析。按照不同的用户信息维度,查找最容易流失的用户群,同业务部门人员配合,辅以相关调查,力求发现用户流失的症结所在。,(三)流失后分析,28%的用户是重入网或反复入网引起的;流失用户的91.6%是在半年内流失(低网龄用户)。,用户流失类型,(一)重入网、反复入网用户挖掘,识别规则:通过对新入网用户使用手机的IMEI号(或身份证号码)与存量用户的IMEI号历史库(或身份证号码历史库)进行分析识别出重入网和反复重入网用户。,(一)重入网、反复入网用户挖掘,识别过程,为了提高分
5、析结果的准确率,每月定期对上月新入网的用户(上月入网并激活的用户)进行分析。分析示意如下:用户在N月入网并激活(有话单产生),则在N+1月(计算月)对N月入网并激活的所有用户进行重入网分析。,产品/价格,促销/宣传,不同品牌及资费存在内部竞争,没有考虑体系间的平衡问题; 预存费用低,用户入网门槛不高,使其可以轻易弃卡。,新入网促销活动优惠力度过大; 品牌及资费资费套餐互转门槛过高,停机保号、套餐互转等宣传不足。,追求经济收益,受入网优惠的吸引; 换取吉祥号码; 欠费停机后选择重入网。,竞争对手以低资费、大力度的优惠活动吸引用户,但整体质量未能让用户满意,从而使用户在短暂离(移动)网后重新入网,
6、内部原因,外部原因,用户原因,渠道/服务,渠道迫于指标压力或利益驱动,自身养卡或诱导用户换卡; 补卡成本高且手续复杂。,(一)重入网、反复入网用户,为了保证数据的完整性和可用性,1、数据准备,(二)低网龄用户挖掘,流失用户在网时长分析,2、初步分析,(二)低网龄用户挖掘,流失用户的91.6% 是在入网后的六个月内流失 流失用户的76% 是在入网后的四个月内流失分别有22.1%和22.8%的流失用户在入网后的第一个月和第二月内流失,数据来源: 12年1月-10月新增用户 流失用户定义:当月停机,且连续停机60天以上用户,到2012年11月仍未开机用户 网龄举例:3月入网,3月流失的用户,网龄为0
7、个月,流失用户的在网时长分布,针对网龄1个月和24个月两个用户群分析,3、进一步分析,(二)低网龄用户挖掘,采用凝聚的方法,4、网龄1个月的流失用户通话业务挖掘,(二)低网龄用户挖掘,网龄1月新增用户细分模型,4、网龄1个月的流失用户数据业务挖掘,(二)低网龄用户挖掘,网龄1月新增用户细分模型,4、网龄1个月的流失用户数据挖掘,(二)低网龄用户挖掘,4、网龄1个月的流失用户数据挖掘,(二)低网龄用户挖掘,5、网龄24个月的流失用户通话业务挖掘,(二)低网龄用户挖掘,网龄24月新增用户细分模型,5、网龄24个月的流失用户数据业务挖掘,(二)低网龄用户挖掘,网龄24月新增用户细分模型,(二)低网龄
8、用户挖掘,5、网龄24个月的流失用户数据挖掘,(二)低网龄用户挖掘,5、网龄24个月的流失用户数据挖掘,根据中国移动历年年报显示,签约用户在网率时间长,且ARPU值一般是预付费用户ARPU值的34倍。具体实现方式有两种: 一种是通过有吸引力的资费套餐将预付费用户转换成签约用户 另一种是直接发展签约用,(一)扩大签约用户比例提高在网率,通过推出各种优惠资费套餐等促销方法拉动用户提高业务使用量,这种方法往往与预付费用户转换成签约用户方法相配套推出。下表是针对不同用户群可以推出的优惠措施:,(二)针对不同用户群推出不同优惠措施,(二)针对不同用户群推出不同优惠措施,对于电信运营商来说,不仅业务要不断创新,不断开发,服务也要不断创新,不断开发。可以推出如下服务:,(三)服务创新,电信市场的竞争,面临残酷态势,一方面有互联网企业的地盘侵蚀,一方面是其他通信公司的业务业务的竞争。只有针对不同的目标群体、快速地推出创新性业务、丰富业务种类、提供差异化服务,才能吸引更多的用户使用,从而提高企业效益。,(四)业务创新,