[发明专利]客户流失预测方法、装置、电子设备和存储介质在审
申请号: | 201911157690.0 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110889724A | 公开(公告)日: | 2020-03-17 |
发明(设计)人: | 刘鹏飞 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/06;G06Q40/02;G06Q40/00 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 刘静 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客户 流失 预测 方法 装置 电子设备 存储 介质 | ||
1.一种客户流失预测方法,其特征在于,应用于电子设备,所述方法包括:
获取待预测的客户数据,其中,所述客户数据包括企业基本信息、经营状况、财务数据、资产数据、信贷数据、交易数据和股权控制数据中的至少一种;
根据所述待预测的客户数据构建目标特征,其中,所述目标特征包括财务特征、贷款特征、资产特征、社区特征和资金交易特征中的至少一个;
将所述目标特征作为输入值,输入到预先训练好的客户流失预测模型中进行预测,并输出预测结果,其中,所述客户流失预测模型通过多个训练样本数据对xgboost算法进行迭代训练获得。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括训练所述客户流失预测模型的步骤,所述步骤包括:
获取多个训练样本数据,其中,所述训练样本数据包括企业基本信息、经营状况、财务数据、资产数据、信贷数据、交易数据和股权控制数据中的至少一种以及该训练样本数据对应的客户是否流失;
根据各所述训练样本数据构建多个特征;
通过因子分析算法,从所述多个特征中选择出与客户是否流失的相关性超过预设值的目标特征,其中,所述因子分析算法包括皮尔逊相关系数算法、正则化方法和基于模型的特征选择方法中的至少一种;
将各所述训练样本数据对应的目标特征及客户是否流失作为输入值,输入到xgboost算法中进行迭代训练,以获得训练好的客户流失预测模型。
3.根据权利要求2所述的方法,其特征在于,在根据各所述训练样本数据构建多个特征之前,所述方法还包括:
对各所述训练样本数据进行预处理,其中,预处理方法包括缺失值处理、异常值处理和规范化处理中的至少一种。
4.根据权利要求2所述的方法,其特征在于,所述训练样本数据包括财务数据和资产数据,所述根据各所述训练样本数据构建多个特征,包括:
基于各所述训练样本数据包括的财务数据及资产数据计算各所述训练样本数据分别对应的财务特征,其中,所述财务特征包括总资产负债率和/或流动负责率。
5.根据权利要求2所述的方法,其特征在于,所述训练样本数据包括资产数据和信贷数据,所述根据各所述训练样本数据构建多个特征,包括:
基于各所述训练样本数据包括的资产数据计算各所述训练样本数据分别对应的资产特征,基于各所述训练样本数据包括的信贷数据计算各所述训练样本数据分别对应的贷款特征,其中,所述贷款特征包括在预设的时间段内的贷款比率,所述资产特征包括在预设的时间段内的资产比率。
6.根据权利要求2所述的方法,其特征在于,所述训练样本数据包括交易数据,所述根据各所述训练样本数据构建多个特征,包括:
基于各所述训练样本数据包括的交易数据计算各所述训练样本数据分别对应的资金交易特征,其中,所述资金交易特征包括在预设的时间段内的资金交易频率和/或在预设的时间段内的平均资金交易量。
7.一种客户流失预测装置,其特征在于,应用于电子设备,所述装置包括:
数据获取模块,用于获取待预测的客户数据,其中,所述客户数据包括企业基本信息、经营状况、财务数据、资产数据、信贷数据、交易数据和股权控制数据中的至少一种;
目标特征构建模块,用于根据所述待预测的客户数据构建目标特征,其中,所述目标特征包括财务特征、贷款特征、资产特征、社区特征和资金交易特征中的至少一个;
预测模块,用于将所述目标特征作为输入值,输入到预先训练好的客户流失预测模型中进行预测,并输出预测结果,其中,所述客户流失预测模型通过多个训练样本数据对xgboost算法进行迭代训练获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911157690.0/1.html,转载请声明来源钻瓜专利网。