[发明专利]基于融合模型的用户风险预测方法、系统和计算机设备有效
申请号: | 202110473736.0 | 申请日: | 2021-04-29 |
公开(公告)号: | CN113298120B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 姜润洲;丁楠;苏绥绥 | 申请(专利权)人: | 上海淇玥信息技术有限公司 |
主分类号: | G06F18/25 | 分类号: | G06F18/25;G06F18/214;G06Q10/0635;G06Q10/04 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 201500 上海市崇明*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 融合 模型 用户 风险 预测 方法 系统 计算机 设备 | ||
1.一种基于融合模型的用户风险预测方法,其用于对分配有资源的用户在资源使用期间的资源使用状态变更进行预测,其特征在于,包括:
获取历史用户的资源使用表现数据、用户风险数据,并基于切分参数建立多个子训练数据集和子测试数据集,所述切分参数包括时间参数和/或渠道参数,该时间参数用于表征将用户的资源使用总时间等间隔划分的时间段,所述时间参数包括资源使用总时间、间隔时间,该资源使用总时间包括6个月、12个月和24个月,间隔时间包括十五天、三十天、六十天;该渠道参数用于表征用户群的数据渠道,所述渠道参数包括渠道类型、渠道名称、与渠道相关的用户交易数据;所述历史用户为在资源使用期间发生了资源使用状态变更的用户群,所述资源使用表现数据包括使用状态变更数据,所述切分参数为单维度或多维度;
建立基于切分参数的多个基模型,并使用相应子训练数据集训练对应基模型,对所述多个基模型进行融合处理,得到初始融合模型,使用机器学习模型学习各基模型的资源使用表现数据与用户风险数据的对应关系、以及所述基模型之间的数据分布变化,得到与各基模型相对应的初始权重系数,并拟合生成与初始融合模型相对应的趋势图;
确定待预测用户的时间特征数据,该时间特征数据包括资源使用总时间T、使用期数T1~Tn、当前资源使用时间Tn,以及该待预测的资源使用时间Tn+t;
使用所述初始融合模型的拟合趋势图,计算该预测用户在资源使用时间Tn+t的用户风险计算值,选出与该用户风险计算值最接近的基模型,并确定资源使用时间为Tn所对应的一个或多个子训练数据集作为增量学习的训练数据集,所述最接近的基模型为一个或多个,在所述初始融合模型的基础上二次融合处理,得到与待预测用户相对应的最终融合模型;
使用所述最终融合模型,计算待预测用户的风险值,预测所述待预测用户的资源使用状态。
2.根据权利要求1所述的用户风险预测方法,其特征在于,所述在所述初始融合模型的基础上二次融合处理,得到与待预测用户相对应的最终融合模型包括:
对所最接近的基模型的初始权重系数进行调整,并使各基模型使用所确定的训练数据集进行增量学习,以得到与待预测用户相对应的最终融合模型。
3.根据权利要求1所述的用户风险预测方法,其特征在于,还包括:
将待预测用户的时间特征数据、与渠道参数相对应的渠道特征数据、资源使用表现数据,输入所述最终融合模型,计算所述预测用户的风险值,该风险值为0~1之间的数值;
根据所计算的风险值,确定用户资源使用状态,该用户资源使用状态包括与风险级别相对应的第一风险状态、第二风险状态、第三风险状态。
4.根据权利要求1所述的用户风险预测方法,其特征在于,还包括:
设定评价指标,通过计算所述评价指标,使用相应子测试数据集,对所述初始融合模型的模型参数进行调整,所述评价指标包括ROC指标、AUC指标,所述模型参数包括各基模型的权重系数;
在所计算的评价指标小于特定阈值时,结束所述初始融合模型的模型参数的调整。
5.根据权利要求1所述的用户风险预测方法,其特征在于,所述资源使用表现数据包括在资源使用的特定时间内的动支次数或频率、在自特定资源使用时间起特定时间内资源未归还数据和未归还次数以及催收数据,所述用户风险数据包括逾期数据和/或违约数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇玥信息技术有限公司,未经上海淇玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110473736.0/1.html,转载请声明来源钻瓜专利网。