[发明专利]召回模型的生成方法及装置有效
申请号: | 202010128593.5 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111369006B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 苏世前;张磊;张元鹏;曾一林;许卫波 | 申请(专利权)人: | 上海蓝书信息科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q40/03 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 200120 上海市中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 召回 模型 生成 方法 装置 | ||
本发明公开了一种召回模型的生成方法及装置,该方法通过风控系统获得样本信息,并对样本信息进行筛选,得到训练样本;将训练样本输入机器学习模型,训练得到召回模型,对召回模型进行优化处理,得到目标召回模型。其中,风控系统表征对初始样本信息进行审核的系统,样本信息包括通过风控系统审核的样本和未通过风控系统审核且没有被交易系统利用的样本。通过对样本信息的筛选和处理,并且能够对召回模型进行优化,提升了模型训练过程中的样本信息的全面性和模型评估的准确性,解决了现有的风控系统中审核偏差的问题,提升了召回模型的有效客户的召回率和满足了实际需求。
技术领域
本发明涉及信息处理技术领域,特别是涉及一种召回模型的生成方法及装置。
背景技术
随着经济的快速发展,信用消费也越来越受关注,信用卡消费、个人汽车贷款、助学贷款、小额消费贷款等各种个人消费贷款日益增多,且增长速度非常快。为了能够对个人的借贷风险进行有效评估,通常会将风险规则和风控模型相结合的方式对个人信息进行风险评估。
在现有的风险评估系统中,模型的训练需要有效的数据。例如,数据的积累是否达到了一定的规模并且是可以做标注的,而且模型的性能依赖于特征的选择。以个人风险识别为例,在风险模型的建立过程中,需要得到用户的还款情况信息来作为标注信息的一部分,进而得到可以用于模型训练的样本数据,这就使得模型训练所用的样本都来源于那些通过风控系统的审核并且成交后有还款记录的订单数据。可见,在风控系统中的模型训练时利用的样本数据较为单一,使得经过风控系统审核后被拒绝的客户不一定是高风险或不可以接收的客户。从而使得风控系统的审核准确度下降,降低了有效客户的召回率,无法满足实际的应用需求。
发明内容
针对于上述问题,本发明提供一种召回模型的生成方法及装置,提升了召回模型的有效客户的召回率和满足了实际需求。
为了实现上述目的,本发明提供了如下技术方案:
一种召回模型的生成方法,所述方法包括:
通过风控系统获得样本信息,所述风控系统表征对初始样本信息进行审核的系统,所述样本信息包括通过所述风控系统审核的样本和未通过所述风控系统审核且没有被交易系统利用的样本;
在所述样本信息中进行筛选,得到训练样本;
将所述训练样本信息输入机器学习模型,训练得到召回模型;
对所述召回模型进行优化处理,得到目标召回模型。
可选地,所述通过风控系统获得样本信息,包括:
获得第一信息、第二信息和第三信息,其中,所述第一信息表征通过所述风控系统第一审核方式审核通过的信息,所述第二信息表征未通过所述风控系统第一审核方式审核的且通过第二审核方式审核的信息,所述第三信息表征均未通过所述风控系统第一审核方式和第二审核方式审核的信息,所述第一审核方式与所述第二审核方式不同;
通过所述第一信息和所述第二信息作为机器学习模型的训练输入,得到第一模型;
利用第一模型对所述第三信息进行评判,得到所述第三信息的第一评分结果;
依据所述第一评分结果,在所述第三信息中筛选得到第一目标样本信息;
根据所述第一信息、所述第二信息和所述第一目标样本信息,生成训练样本信息。
可选地,所述依据所述第一评分结果,在所述第三信息中筛选得到第一目标样本信息,包括:
依据所述第一评分结果,获取所述第三信息在各个分数段的样本个数;
利用所述第一模型对所述第一信息和所述第二信息进行评分,得到所述第一信息和所述第二信息在各个分数段的样本个数以及在各个分数段的满足预设第一条件的样本比例,所述预设第一条件表征样本不合格的条件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海蓝书信息科技有限公司,未经上海蓝书信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010128593.5/2.html,转载请声明来源钻瓜专利网。