1、 数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司 1汕 头电 信低 质 用 户 活 跃 度提升解决方案-2017.12.25数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司目录一一 数据挖掘项目经验2二二 IPTV活跃度提升解决方案三三 套餐流量使用率提升解决方案数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司五个数据挖掘模型,两个客户画像标签3G升 4G换 卡模型( 营销 响 应 模型)政企 专线 离网 预 警模型(用 户 保有模型)双百兆目 标 用 户 模型( 营销 响 应 模型)乐 享 5折用 户 聚 类 模型(用 户 画像刻画)乐 享 5折用 户 生命周期分析(用
2、户 画像刻画)手机加副卡目 标 用 户 模型( 营销 响 应 模型)乐 享 5折目 标 用 户 模型( 营销 响 应 模型)数据挖掘客 户标签(数据挖掘基 础 能力沉淀)数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司3G升 4G换卡营销模型目 标 为提升当前 3G升级 4G营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销。截止 9月份,共提供 5批次,共 计 48.2万精确目 标 用 户营销 清 单给 外呼相关部 门进 行 营销测试分区 预测在网 预测离网 实际在网 536,691 31374实际离网 21689 7522离网命中率 19.30%离网覆盖率 25.8%提升
3、度 3.95模型评估 模型实际应用营销成功率数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司双百兆目标用户模型目 标为提升当前营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销。本模型以老宽带用户为出发点,以是否融合划分不同子模型,利用随机森林算法,构建最终目标用户模型。模型评估测试 分区 预测 未 办 理 预测办 理实际 未 办 理 59,563 2650实际办 理 1940 9049办 理命中率 77.30%办 理覆盖率 82.30%提升度 5.15模型 实际应用月份 外呼量 接通量 接通率 接通后成功率 总 体成功率201609 17736 4798 27% 2.3%
4、0.6%201610 6666 2381 36% 3.2% 1.1%201611 22821 8360 37% 2.8% 1.0%模型经过 10月, 11月两月实际应用,接通率,接通后成功率及总体成功率均比未使用模型前有明显提升。 10月总体成功率接近 9月的两倍。数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司手机加副卡目标用户模型目 标为提升当前营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销。手机加副卡模型分成两部分,一部分为网龄 3个月以上的用户,另一部分为网龄 3个月以下的用户。利用逻辑回归算法和 KNN分类算法,分别构建模型。测试 分区 预测 未 办 理 预测办
5、 理实际 未 办 理 35946 679实际办 理 4335 2948办 理命中率 81.2%办 理覆盖率 40.4%提升度 10.5 逻辑回归模型评估变 量名称 系数套餐内流量 129.4764099用 户类 型 40.28923193合同剩余月份数 11.35521583近 3月月均充 值 金 额 4.687194277套餐小 类 -4.658930608同客 户 下手机流量 -2.077296871同客 户 下 4G手机流量 0.936129902同客 户 下 4G用 户 数 0.888651916语 音使用率 -0.854310481逻辑回归 模型系数注:系数的绝对值越大,对模型的影响
6、越大。测试 分区 预测 未 办 理 预测办 理实际 未 办 理 117079 3219实际办 理 5725 5664办 理命中率 63.7%办 理覆盖率 49.7%提升度 7.4 KNN分类模型评估KNN分类模型字段重要性数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司政企离网预警模型目 标 通过深度数据挖掘方法,挖掘政企专线用户离网规律,并提前 2个月预测用户离网概率测试分区 预测在网 预测离网实际在网 4,507 277实际离网 137 109离网命中率 27.23%离网覆盖率 47.15%模型的效能( ROC)曲线数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司乐享 5折目标
7、用户模型目 标为提升当前营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销,利用随机森林算法,构建最终目标用户模型。模型评估字段重要性测试 分区 预测 未 办 理 预测办 理实际 未 办 理 51599 300实际办 理 1921 2954办 理命中率 90.8%办 理覆盖率 60.5%提升度 10.5 月份 外呼量 接通量 接通率 接通后成功率 总体成功率201610 4497 1533 34% 2.9% 1.1%201611 5056 1870 37% 2.8% 1.0%模型实际应用模型效能( ROC)曲线数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司乐享 5折用户聚类
8、模型 为了提高乐享 5折用户的活跃度及价值,我们将对用户进行分群,以达到精细化营销的目的。根据聚类模型的数据要求,需要 观测用户在 基准月前 3个月及次月 的行为表现,因此选取 2016年 2月作为基准月 。 2016年 2月,出账用户 17.6万 ,其中,套餐使用时长不足 3个月的用户 2.3万 ,疑似用完即扔用户 1707户 ,疑似养卡用户 6709户 。基于精细化营销的目的,剔除套餐使用时长不足 3个月及疑似养卡、用完即扔用户,最后聚类的目标用户 12.4万户 ,接下来的聚类模型针对这部分用户进行 建模 。出账用户: 17.6万正常: 16.5万 停 /预拆: 1.1万 疑似用完即扔 :
9、 T+4个月内开始产生欠费,并且欠费后连续 2个月依然有欠费记录用户 疑似养卡: 省公司模型清单疑似用完即扔:1707疑似养卡: 6709套餐使用时长 3: 2.3万聚类目标用户: 12.4万数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司聚类模型构建思路数据输入行为字段相关性分析价值字段相关性分析Z-SCORE标准化行为因子分析Z-SCORE标准化价值因子分析行为层次聚类两步聚类价值层次聚类两步聚类价值 -行为聚类混合聚类行为相关字段 价值相关字段降维标准化降维聚类建模模型优化群特征分析群策略建议 本次 聚类模型的构建 ,采用聚类数据挖掘中成熟的 “行为 -价值 ”分析框架,分别 对用
10、户的行为和价值特征进行聚类 ,并总结用户在这两个维度上的特征,从而给出用户画像 由于聚类模型对于输入字段的要求,需要对行为字段和价值字段进行 Z-SCORE标准化及主成分算法分析,降维之后作为输入, 通过测试多个聚类算法 ( K-MEANS聚类算法、两步聚类算法)并 选择聚类模型 通过聚类的结果,分析不同用户群的特征 ,并针对用户特征 提出针对性的营销策略数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司行为 -价值分群平面图平均 ARPU平均流量X-1 低值温饱群X-6 中档低活跃群X-2 传统节省群 X-3 低端时尚群 X-4 流量活跃群 X-5 通话活跃群 X-7 高端稳定群通过观察
11、用户分类在年龄、通话、流量、短信、在网时长、离网、 ARPU、欠费等方面的特征及趋势,将用户分为以下 7个典型用户群用户分群分布图 分群号 分群名称 用户数 用户占比X-1 低端温饱群 35346 27.3%X-2 传统节省群 23824 18.4%X-3 低端时尚群 19849 15.3%X-4 流量活跃群 14710 11.3%X-5 通话活跃群 14734 11.4%X-6 中档低活跃群 6466 5.0%X-7 高值稳定群 14727 11.4%数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司七大用户群客户画像 本地消费能力较低的中老年群体,社交圈子较小,只有基础的通话需求X-1
12、 低端温饱群 27.3% 本地有一定消费能力的中老年群体,有一定社交圈子,主要通信需求为通话,没有形成流量使用习惯X-2 传统节省群 18.4% 外来人口中消费能力较强的群体,通话活跃度非常高,且人均漫游通话时间最长,但流量需求低X-5 通话活跃群 11.4% 有一定消费能力的时尚年轻群体,终端新、流量使用非常活跃,同时也有一定通话需求X-4 流量活跃群 11.3% 本地年轻人群,消费能力不高,但追求新终端、偏好使用流量,群体流量贡献度大X-3 低端时尚群 15.3% 忠诚的电信老用户,通话、流量活跃度高,流失率低,终端新 外来人口人群,漫游通话需求量大,终端旧,通话和流量活跃度低,资费敏感,
13、流失率高X-6 中档低活跃群 5.0%X-7 高值稳定群 11.4%ARPU值活跃度数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司针对性营销策略建议根据构建的聚类模型,应用到 4月份用户,其分群简要情况如下:分群号 分群名称 总用户数 单产品用 户 个 人单产品 用户 个人单产品用户占总体比例 营销政策X-1 低端温饱群 32615 30975 30070 22.8% 亲情圈子等增强用户黏性产品 X-2 传统节省群 29275 28853 28435 21.6% 话费充值送优惠、预存优惠 X-3 低端时尚群 21758 21098 20693 15.7% 4G终端升级,新千元机终端推荐
14、,流 量 包推荐X-4 流量活跃群 17320 17028 16665 12.6% 4G终端升级,新中高端终端 推荐,流量包推荐,内容增值产品 推荐X-5 通话活跃群 14246 14004 13750 10.4% 基础话 务包推荐 ,漫游话务包,套餐档次 升级X-6 中档低活跃群 6412 6260 5975 4.5% 预存送话费,提高本金余额 ,漫游话务包推荐X-7 高值稳定群 17073 16760 16333 12.4% 积分礼品兑换等客户关怀手段 数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司乐享 5折用户生命周期分析n 对分析用户的户均 ARPU、流量、主被叫、短信、销户率
15、和终端更换率进行综合分析,发现 流量使用量 随着 终端更换率 的 提升而逐步提升 。n T+5月 之后在主叫通话时长未出现明显增加的情况下, 流量逐月增加 ,但ARPU值并未表现出增加 迹象,用户的流量使用习惯逐步养成。n T+17月 后用户的销户率处于整个生命周期当中较低的水平,并趋势稳定。数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司可为用户特征分析 销户结点 (1/2)销户 正常ARPU84.280.9销户 正常流量6341568销户 正常主叫47 225针对 T+3月销户用户和在网 8月以上正常用户,在 T+2月进行特征比较,销户用户主叫语音时长为 正常用户的 21%,流量为
16、正常用户的 40%, ARPU无明显变化。单位:元 单位:兆 单位:分钟通过建模发现 T+3月销户用户 中 ,变量重要性前三的指标为: T+2月主叫环比上月减少62.8%, T+2月被叫小于等于 21.5分钟, T+0月 ARPU大于 61.2元。T+2月主叫环比上月减少 62.8%T+2月被叫小于等于21.5分钟T+0月 ARPU大于 61.2元数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司可为用户特征分析 销户结点 (2/2)测试分区 预测在网 预测离网实际在网 30349 2220实际离网 1812 2358离网命中率 51.51%离网覆盖率 56.55%模型评估 模型效能( R
17、OC)曲线字段重要性关键字段解释字段 影响T+2月主叫环比上月主叫通话时长在 T+2月环比上月减少62.8%的用户中表现较高的销户概率。T+2月被叫 T+2月被叫通话时长小于 15.5分钟下时,存在一部分高销户概率用户。T+0月ARPUT+0月 ARPU越高用户的销户概率越高。T+2月ARPUT+2月 ARPU高于 48.8元时结合 T+0月ARPU高于 60元,用户销户概率较高。建模对 T+3月销户用户进行分析,并评估模型效果,离网用户 命中率达到 51.51%,离网覆盖率达到 56.5%。其中关系到离网的主要字段 T+2月主叫环比上月 重要性达到 63.8%。数据蕴含价值 信息创造未来 广
18、州市网迅信息技术有限公司目录一一 数据挖掘项目经验17二二 IPTV活跃度提升解决方案三三 套餐流量使用率提升解决方案数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司IPTV用户活跃度提升方案IPTV用户结构的差异决定着用户行为习惯的不同,要改善 IPTV用户活跃度,需了解汕头地市 IPTV用户结构、用户使用习惯;从而针对特殊用户进行精准运营的目的。IPTV用 户结 构IPTV用 户视频兴 趣IPTV用 户建模聚 类针对 不同特征用 户 包装特色 节 目运 营以 节 目改善用户 使用 习惯短信触 发数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司IPTV用户整体结构IPTV用户(以
19、广州为例)主要覆盖高学历高收入的群体,多人家庭为主,是社会中流砥柱 ;视频网站用户则多为初入社会的青年人群 ;有线电视用户主要是中老年成熟人群。相对而言, IPTV与网络视频的用户交叉比例较高,达到 50%以上。用户形象描述性别年龄分布学历职业地位平均家庭月收入家庭结构ITV用户 有线电视用户 视频网站用户社会中流砥柱 中老年成熟人群 初入社会的青年人群男性比例略高,占 6成 无明显性别偏向 男性比例率高 55.2%25-35岁 (42%)&41岁及以上 (33.3%) 41岁及以上 (69.3%) 30岁及以下 (61.6%)大学专科及以上70.8%大学专科及以上27.5%大学专科及以上88
20、.5%74%拥有稳定工作,20.2%担任管理工作 - -¥ 16198 ¥ 7203 ¥ 10154多人家庭占比 75% - -数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司n 对使用 IPTV的用户喜欢什么类型的节目进行网络调研,最受欢迎的节目类型为电影大片、其次为热播电视剧,最不受欢迎的节目为健康养生类。IPTV用户视频兴趣 数据来源问卷星数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司1 2 3 4 5 7 8确定影响因子选 取 样 本空 间数据 预处 理变 量抽 样 和平衡6算法建模模型 评 估模型 优 化运 营 清单建模思路按照已办理 IPTV用户,拍照选取样本数据,进
21、行数据挖掘算法聚类,分析目前用户的行为、消费特征。最后依据聚类清单,针对不同用户进行运营,提升用户活跃度。数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司目录一一 数据挖掘项目经验22二二 IPTV活跃度提升解决方案三三 套餐流量使用率提升解决方案数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司套餐内流量活跃度提升方案移动用户结构的差异决定着用户行为习惯的不同,要改善 4G用户流量使用活跃度,需了解汕头地市移动 4G用户结构、用户使用习惯;从而针对特殊用户进行精准运营的目的。乐 享 4G套餐飞 yang套餐各自套餐用户结 构针对 不同特征用 户以副卡、免 费视频 包等,改善用 户
22、使用 习惯电信4G产品外呼、短信触 发 用 户数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司从用户入网当月后,在整个生命周期内形成一个完整的行为画像(广州电信用户),可看出:u 用户在 T+0至 T+3月之间表现出 流量、通话 极不稳定的状态;u 在 T+3月 出现 销户率峰值 ,并在随后几月依旧表现出较高的销户率;u 在 T+8月 后用户使用行为和价值行为表现 平稳 ;u 在 T+14月 出现 流量 缓慢 上升结点 ,流量的使用表现出逐步增加的走势;u 到 T+16月 ,用户 终端跟换率出现明显上升趋势 ,同时 T+17月 之后出现 较低的销户率,并趋于平稳 。1、在 T+3月 销户
23、用户表现出通话和流量使用量极少的特征,需要对销户高危用户进行 维系挽留 ,延长用户生命周期。2、在 T+14月环比上月流量上升 10%以上的用户可对其加大 流量类增值产品的营销, 这批用户在后续几月同样表现出较高的流量需求,可先通过 短期免费体验包 进行流量习惯使用培养。3、对处于 T+16月以上 阶段的用户进行 价值流量营销 ,这部分用户在接下来几月表现出较低的销户率,以及较高的终端更换率,随着终端的更换,用户对 流量的需求 也加大。入网结点 价值稳定结点销户结点T+0 T+3 T+8 T+14 T+16流量上升结点终端更换结点套餐适应期 高流失期 价值稳定期 流量成长期 忠诚用户低流失期运营建议乐享 用户 生命周期画像数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司1 2 3 4 5 7 8确定影响因子选 取 样 本空 间数据 预处 理变 量抽 样 和平衡6算法建模模型 评 估模型 优 化运 营 清单建模思路按照套餐用户,拍照选取样本数据,进行数据挖掘算法聚类,分析目前用户的行为、消费特征,移动用户特别关注视频 app类节目爱好。最后依据聚类清单,针对不同用户进行运营,提升用户活跃度。数据蕴含价值 信息创造未来 广州市网迅信息技术有限公司Thanks For Your Time感谢聆听