[发明专利]客户流失预测方法、装置、电子设备和存储介质在审
申请号: | 201911157690.0 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110889724A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 刘鹏飞 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/06;G06Q40/02;G06Q40/00 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 刘静 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客户 流失 预测 方法 装置 电子设备 存储 介质 | ||
本申请实施例提供的客户流失预测方法、装置、电子设备和存储介质,所述方法包括:将由待预测的客户数据构建的目标特征输入到预先训练好的客户流失预测模型中进行预测,输出最终的预测结果,得出该客户是否可能会流失。通过上述方法能够较为准确地预测出客户是否可能流失,使从业人员能够根据模型的预测结果制定相应的挽留策略,在客户流失之前挽留客户,减少由于客户流失带来的损失。
技术领域
本申请涉及数据处理技术领域,具体而言,涉及一种客户流失预测方法、装置、电子设备和存储介质。
背景技术
现有技术中,由于客户流失对企业利润的影响巨大,当前客户流失问题受到广泛的重视。例如,在竞争越来越激烈的银行业,各个银行获得新客户不仅需要花费较多的时间成本,而且大多数新客户产生的利润低于老客户产生的利润,因此,如何准确地预测出客户是否存在潜在流失是本领域技术人员需要解决的问题。
发明内容
有鉴于此,本申请的目的在于提供客户流失预测方法、装置、电子设备和存储介质,以预测客户是否流失。
第一方面,实施例提供一种客户流失预测方法,应用于电子设备,所述方法包括:
获取待预测的客户数据,其中,所述客户数据包括企业基本信息、经营状况、财务数据、资产数据、信贷数据、交易数据和股权控制数据中的至少一种;
根据所述待预测的客户数据构建目标特征,其中,所述目标特征包括财务特征、贷款特征、资产特征、社区特征和资金交易特征中的至少一个;
将所述目标特征作为输入值,输入到预先训练好的客户流失预测模型中进行预测,并输出预测结果,其中,所述客户流失预测模型通过多个训练样本数据对xgboost算法进行迭代训练获得。
在可选的实施方式中,所述方法还包括训练所述客户流失预测模型的步骤,所述步骤包括:
获取多个训练样本数据,其中,所述训练样本数据包括企业基本信息、经营状况、财务数据、资产数据、信贷数据、交易数据和股权控制数据中的至少一种以及该训练样本数据对应的客户是否流失;
根据各所述训练样本数据构建多个特征;
通过因子分析算法,从所述多个特征中选择出与客户是否流失的相关性超过预设值的目标特征,其中,所述因子分析算法包括皮尔逊相关系数算法、正则化方法和基于模型的特征选择方法中的至少一种;
将各所述训练样本数据对应的目标特征及客户是否流失作为输入值,输入到xgboost算法中进行迭代训练,以获得训练好的客户流失预测模型。
在可选的实施方式中,在根据各所述训练样本数据构建多个特征之前,所述方法还包括:
对各所述训练样本数据进行预处理,其中,所述预处理包括缺失值处理、异常值处理和规范化处理中的至少一种。
在可选的实施方式中,所述训练样本数据包括财务数据和资产数据,所述根据各所述训练样本数据构建多个特征,包括:
基于各所述训练样本数据包括的财务数据及资产数据计算各所述训练样本数据分别对应的财务特征,其中,所述财务特征包括总资产负债率和/或流动负责率。
在可选的实施方式中,所述训练样本数据包括资产数据和信贷数据,所述根据各所述训练样本数据构建多个特征,包括:
基于各所述训练样本数据包括的资产数据计算各所述训练样本数据分别对应的资产特征,基于各所述训练样本数据包括的信贷数据计算各所述训练样本数据分别对应的贷款特征,其中,所述贷款特征包括在预设的时间段内的贷款比率,所述资产特征包括在预设的时间段内的资产比率。
在可选的实施方式中,所述训练样本数据包括交易数据,所述根据各所述训练样本数据构建多个特征,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911157690.0/2.html,转载请声明来源钻瓜专利网。