[发明专利]拒客回捞模型训练方法、装置及电子设备在审
申请号: | 202110713287.2 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113313582A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 顾凌云;谢旻旗;段湾;乔韵如;王震宇 | 申请(专利权)人: | 上海冰鉴信息科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06N20/00 |
代理公司: | 成都顶峰专利事务所(普通合伙) 51224 | 代理人: | 钱学宇 |
地址: | 200000 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 拒客回捞 模型 训练 方法 装置 电子设备 | ||
本申请提供一种拒客回捞模型训练方法、装置及电子设备,所述方法包括:根据用户数据训练样本确定入模变量并输入待训练模型进行处理,获得输出结果;根据样本标签、输出结果及预设的目标函数对待训练模型的模型参数进行调整;待训练模型的损失函数包括表征正样本的损失函数值的第一函数项和表征负样本的损失函数值的第二函数项,第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,第一惩罚系数大于第二惩罚系数。如此,可以使得对将正样本预测为负样本的关注度高于将负样本预测为正样本,从而提高模型对正样本预测的准确度,确保模型在实际使用中回捞客户的风险在可控范围内。
技术领域
本申请涉及大数据技术领域,具体而言,涉及一种拒客回捞模型训练方法、装置及电子设备。
背景技术
拒客回捞是近年发展起来的一种风控模式,指的是金融放贷机构在一道风控业务已经拒绝过的客群中,构建新的风控模型进行二道筛选,并在确保风险可控的基础上尽可能回捞部分客户进行放贷。拒客回捞模式能够降低金融放贷机构的获客成本,在稳定风险的基础上进一步提高通过率。
在建模思路上,拒客回捞模型与信用评估模型有明显的差异。因为拒客回捞模型需首先确保风险可控,对逾期率的关注高于通过率,所以使用实际业务场景中,对“将正样本预测为负样本”的关注度高于将“将负样本预测为正样本”,因此传统的信用评估模型不适用于拒客回捞场景。
发明内容
为了克服现有技术中的上述不足,本申请的目的在于提供一种拒客回捞模型训练方法,其特征在于,所述方法包括:
获取包括多个用户数据训练样本,所述用户数据训练样本包括正样本及负样本,所述正样本的样本标签表征不需要回捞的用户,所述负样本的样本标签表征需要回捞的用户;
对所述用户数据训练样本进行特征提取和特征筛选,确定入模变量;
将所述用户数据训练样本和所述入模变量输入待训练模型进行处理,获得所述用户数据训练样本的输出结果;
根据所述用户数据训练样本的样本标签、所述输出结果及预设的目标函数对所述待训练模型的模型参数进行调整;
其中,所述待训练模型的损失函数包括表征所有正样本的损失函数值的第一函数项和表征所有负样本的损失函数值的第二函数项,所述第一函数项包括表示正样本被预测为负样本时的第一惩罚系数,所述第二函数项包括表示负样本被预测为正样本时的第二惩罚系数,所述第一惩罚系数大于所述第二惩罚系数。
在一种可能的实现方式中,所述目标函数的公式如下:
其中,yi表示用户数据训练样本i的真实标签,表示用户数据训练样本i的预测标签为正样本的概率;
数据项为所述第一函数项,w0表示所述第一惩罚系数;表示不同正样本计算损失函数值的调制系数,r表示权重调整比例,r≥0;
数据项为所述第二函数项,w1表示所述第二惩罚系数;表示不同负样本计算损失函数值的调制系数,r表示权重调整比例,r≥0。
在一种可能的实现方式中,所述方法还包括:
根据用户数据训练样本中正负样本比例进行设置所述第一惩罚系数、第二惩罚系数及权重调整比例;或
使用所述用户数据训练样本进行网格搜索以确定所述第一惩罚系数、第二惩罚系数及权重调整比例。
在一种可能的实现方式中,所述方法还包括:
使用所述用户数据训练样本和所述入模变量,对待训练模型进行多次训练获得不同的已训练模型;其中,每次训练使用的不同的系数进行网格搜索;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海冰鉴信息科技有限公司,未经上海冰鉴信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110713287.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种机制砂低收缩高保坍混凝土
- 下一篇:一种地漏