基于机器学习的电信客户流失分析与研究
摘要:随着互联网时代的进一步发展,中国电信市场的竞争日益激烈,客户流失的情况也愈显突出。5G时代的到来,竞争进一步加剧,也让各电信公司更加关注客户流失问题。对于电信公司来说,客户流失不仅会影响公司的收入和投资回报率,还会影响到公司的声誉、增加成本,因此降低客户流失率,成为当今电信公司重要课题。电信公司手中掌握着大量的用户数据,却苦于无法从数据中充分获得其潜在的商业价值,电信公司必须向数据驱动的商业模式转变,提升竞争力。本文通过运用机器学习相关技术对电信公司已脱敏的客户数据进行分析,在此基础上对客户流失行为进行预测,为公司提供参考和预警作用,并进一步结合互联网营销策略设计客户流失预防体系,降低电信公司的流失率。
关键词:机器学习;客户流失;电信;随机森林;神经网络
一、文献综述
- 从机器学习算法挖掘角度:
林小榕(2019)从数据处理方面对运营商用户流失预测数据不均衡问题进行了研究,提出了基于生成对抗网络的过采样方法生成部分流失用户数据,并与常用的随机过采样、SMOTE、Borderline-SMOTE和ADASYN等方法对用户数据不均衡问题的影响进行了对比分析。结果表明,他提出的生成对抗网络过采样方法在提高LightGBM流失预测模型的正确率、召回率和F1值方面具有更好的效果。
王少芬(2007)等利用聚类分析和决策树,对客户细分、客户流失和客户挽留场景进行分析。郭明等用贝叶斯网络筛选客户流失指标,相比于决策树和神经网络,在抽样方面取得了更好的效果。邱伟基于随机森林算法的集成学习算法——EDCS-Random Forest,通过对每个用户的设置TP/TNFP/FN代价并采取基于代价敏感的剪枝策略,模型显著地提高了召回率,模型预测能力得到提升。
云微和韩明远(2020)利用数据可视化的手段对流失客户的相关信息进行处理,在原有数据基础上制作相关的数据模型图表,探求各变量之间的相关性,并结合市场调研和实际情况对客户的流失问题作出评估,使结论更具有实用性和可靠性,符合商业价值和社会价值。
徐树乔(2019)提出了如下解决方案:通过Apache Hadoop和Spark的分布式架构的大数据平台整合了来自异构数据源的电信运营数据;通过图论、自然语言、栈式自动编码神经网络等方法挖掘了电信用户大数据下隐藏的特征信息;对比了几种针对类不平衡数据集的采样方法和多种采样方式混合的方法;提出基于XGBoost的Bagging方法结合混合采样方法的融合模型,充分利用了不平衡数据集,构建了二分类模型对电信用户进行流失预测。最终在实验中,通过常用的模型评价指标精确率、召回率、AUC等,并结合流失客户挽留活动的期望利润验证模型的效果。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。