[发明专利]模型训练方法、装置、设备及计算机可读存储介质有效
| 申请号: | 202010189398.3 | 申请日: | 2020-03-17 |
| 公开(公告)号: | CN111400663B | 公开(公告)日: | 2022-06-14 |
| 发明(设计)人: | 张鹏 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
| 主分类号: | G06F17/18 | 分类号: | G06F17/18;G06N20/00;G06Q40/02 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 徐进之 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明涉及金融科技技术领域,公开了一种模型训练方法、装置、设备及计算机可读存储介质。该方法包括:获取样本用户的第一和第二风险数据集、标注标签;按预设时段对第一和第二风险数据集中的数据进行处理,得到同时段位移特征数据;对第一和第二风险数据集中的数据进行合并,得到合并风险数据集,并基于合并风险数据集提取得到目标特征数据;基于同时段位移特征数据、目标特征数据和标注标签构建训练样本集,并通过训练样本集对预设风险识别模型进行训练,得到训练好的风险识别模型。本发明从位移、空间、和时间三个角度对风险数据进行总结和变量计算,以用于训练风险识别模型,可提高风险识别结果的准确性,提升模型的风险识别效果。
技术领域
本发明涉及金融科技(Fintech)的数据处理技术领域,尤其涉及一种模型训练方法、装置、设备及计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
信贷风险管理通过风险识别、计量、监测和控制等程序,对风险进行评级、分类、报告和管理,保持风险和效益的平衡发展,提高贷款的经济效益。对于个人信贷业务来说,风险管理就是结合各种导致个人发生违约的因素,识别个人发生违约的风险,并在全流程中进行管理和控制。
现有的个贷风险识别方法主要是基于评分卡模型,而影响评分卡模型效果的重要因素之一就是输入变量的质量,好的变量要满足区分力高、解释性强和跨时点稳定等特性,需要对数据有比较深的理解,从而从中抽象出有效信息,去除噪声。然而,现有变量主要是对于底层信息的一些统计,较为基础和笼统,导致训练得到的模型风险识别效果较差。
发明内容
本发明的主要目的在于提供一种模型训练方法、装置、设备及计算机可读存储介质,旨在提升模型的风险识别效果。
为实现上述目的,本发明提供一种模型训练方法,所述模型训练方法包括:
获取样本用户在第一时间内的第一风险数据集、在第二时间内的第二风险数据集和标注标签;
按预设时段对所述第一风险数据集和所述第二风险数据集中的数据进行处理,得到同时段位移特征数据;
对所述第一风险数据集和所述第二风险数据集中的数据进行合并,得到合并风险数据集,并基于所述合并风险数据集提取得到目标特征数据;其中,所述目标特征数据包括时段间位移特征数据、空间类特征数据和时间类特征数据;
基于所述同时段位移特征数据、所述目标特征数据和所述标注标签构建训练样本集,并通过所述训练样本集对预设风险识别模型进行训练,得到训练好的风险识别模型。
可选地,所述按预设时段对所述第一风险数据集和所述第二风险数据集中的数据进行处理,得到同时段位移特征数据的步骤包括:
根据样本用户的用户标识,从所述第一风险数据集和所述第二风险数据集中获取同一样本用户处于不同位置时的数据,得到第一数据子集和第二数据子集;
按预设时段对所述第一数据子集和所述第二数据子集中的数据进行相似度计算,得到同时段位移特征数据。
可选地,所述按预设时段对所述第一数据子集和所述第二数据子集中的数据进行相似度计算,得到同时段位移特征数据的步骤包括:
按预设时段从所述第一数据子集和所述第二数据子集中获取同一样本用户同一时段处于不同位置时连接天数的最大值和最小值;
对所述最大值进行加和,得到最大值和,并对所述最小值进行加和,得到最小值和;
基于所述最小值和所述最大值进行除法运算,得到同时段位移特征数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010189398.3/2.html,转载请声明来源钻瓜专利网。





