[发明专利]一种用于对模型输出分进行校准的方法和装置在审

专利信息
申请号: 202111010553.1 申请日: 2021-08-31
公开(公告)号: CN113918878A 公开(公告)日: 2022-01-11
发明(设计)人: 刘宏剑;严澄;杨青 申请(专利权)人: 度小满科技(北京)有限公司
主分类号: G06F17/15 分类号: G06F17/15;G06F17/18;G06Q40/02
代理公司: 北京启坤知识产权代理有限公司 11655 代理人: 李琛
地址: 100193 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 用于 模型 输出 进行 校准 方法 装置
【说明书】:

发明的目的是提供一种用于对模型输出分进行校准的方法和装置。所述方法包括以下步骤:使用评分模型对样本集进行评分,得到各个样本对应的模型输出分和逾期标签;根据所述各个样本对应的模型输出分和逾期标签,得到用于拟合变换函数的多个数据点;基于所述多个数据点进行拟合,得到相应的变换函数;基于所述变换函数,对模型输出分进行校准。本申请实施例具有以下优点:通过使用非线性的自定义函数作为变换函数,提升了校准函数的拟合能力;通过将模型输出分数的优势比的对数值作为变换函数的入参,相较于现有的普拉特缩放校准方案,提升了校准效果。

技术领域

本发明涉及计算机技术领域,尤其涉及用于用于对模型输出分进行校准的方法和装置。

背景技术

在信贷业务场景下,使用者需要关注模型输出某一分值时所代表的真实概率。传统的信贷风控业务中大多使用逻辑回归模型来预测客户的逾期风险。逻辑回归模型的输出值天然具有概率性质,一般无需对模型输出结果做校准。

然而,随着类似于支持向量机这种并非以最小化交叉熵为目标函数的模型开始被应用于风控业务中,模型输出分相对于真实逾期概率可能会发生偏离。若是在训练模型前对训练样本集做了过采样、欠采样处理,或是赋予不同样本不同的权重,则模型输出分更是无法代表全量样本的逾期概率。这种情形下,必须先对模型输出分做校准后,才能提供给业务方使用。

基于现有技术的方案中比较常见的校准方案是普拉特缩放(Platt Scaling),普拉特缩放方案以模型输出分为自变量,以样本标签为预测目标,选用逻辑回归模型进行建模,并将逻辑回归模型的输出值作为校准结果。这里,普拉特缩放实质上是利用了逻辑回归模型输出值等价于逾期概率的性质。普拉特缩放的函数形式如下所示:

对该普拉特缩放的函数形式稍加变换,表示如下:

其中,方程等号左侧是样本真实逾期概率的优势比的对数值,右侧是对模型输出分的线性变换。但线性变换关系过于简单,对模型输出分的修正较为有限。若是方程左侧的计算值相对于f(xi)的散点分布近似于线性分布,通过普拉特缩放就能够得到较好的校准效果;若不是,则普拉特缩放效果不佳。

从样本分布及上面方程等号两侧的取值范围做分析。f(xi)为概率值,取值范围为(0,1),故等号右边部分的取值范围为(B,A+B)。在信贷风控业务中,零样本的数目远多于正样本,模型分f(xi)的值多数趋近于零,故等号右边部分数值分布是个严重有偏的分布。在等号左侧,对有偏的概率值的优势比再取对数之后,数值分布更接近取值范围为(-∞,∞)的正态分布。f(xi)概率值的分布越接近于0,则等号左侧的正态分布整体向负值方向移动远离原点,但依然服从正态分布。

因此,由于公式(2)所示的普拉特缩放函数的等号左侧和右侧的数值取值范围不同,数值分布不同,通过普拉特缩放获得的信用分校正结果效果有限,有较大的优化空间。

发明内容

本发明的目的是提供一种用于对模型输出分进行校准的方法和装置。

根据本申请的实施例,提供了用于对模型输出分进行校准的方法,其中,所述方法包括以下步骤:

使用评分模型对样本集进行评分,得到各个样本对应的模型输出分和逾期标签;

根据所述各个样本对应的模型输出分和逾期标签,得到用于拟合变换函数的多个数据点,其中,所述数据点的横坐标为部分样本模型输出分的平均分的优势比的对数值,纵坐标为部分样本真实逾期概率的优势比的对数值;

基于所述多个数据点进行拟合,得到相应的变换函数,其中,所述变换函数为非线性函数;

基于所述变换函数,对模型输出分进行校准。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111010553.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top