[发明专利]融合后验概率校准的模型训练方法、装置、设备及介质有效

专利信息
申请号: 202111487688.7 申请日: 2021-12-08
公开(公告)号: CN113887679B 公开(公告)日: 2022-03-08
发明(设计)人: 周刚;江静;琚生根 申请(专利权)人: 四川大学
主分类号: G06K9/62 分类号: G06K9/62;G06F30/27
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 王新哲
地址: 610065 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 融合 概率 校准 模型 训练 方法 装置 设备 介质
【说明书】:

发明实施例公开了一种融合后验概率校准的模型训练方法、装置、设备及介质,方法包括:首先将第一预设数量的样本输入至分类模型以进行预测,得到每个样本的预测类别和预测后验概率;接着,根据每个样本的预测后验概率,将第一预设数量的样本划分至概率区间中,即对样本进行区间分类;再统计每个概率区间内,每种预测类别的样本的数量和每种预测类别的所有样本中预测正确的样本的数量,得到经验后验概率;根据每个样本对应的预测后验概率和经验后验概率,计算概率损失值,并根据概率损失值训练分类模型。由此,本发明实施例使得模型输出的预测后验概率与真实置信度匹配,避免了模型出现“盲目自信”的情况。

技术领域

本发明涉及神经网络模型领域,尤其涉及一种融合后验概率校准的模型训练方法、装置、设备及介质。

背景技术

随着网络模型的深度和宽度的增加,网络模型在训练过程中的预测准确率逐步提升,而网络模型输出的后验概率,即置信度也逐步随之增长,如网络模型预测样本的类别时,输出的后验概率大多在90%以上。

然而,网络模型在实际的应用中或在验证集进行验证时,大多检测目标的置信度都很高,普遍超过90%,只有较少检测目标的置信度落入10%~90%之间,但整体检测目标对应的预测准确率却很低,即网络模型存在“盲目自信”的情况。

发明内容

有鉴于此,本发明提供一种融合后验概率校准的模型训练方法、装置、设备及介质,用于改善模型的预测准确率与置信度不匹配,从而出现“盲目自信”的现状。

第一方面,本发明实施例提供一种融合后验概率校准的模型训练方法包括:

将训练集中第一预设数量的样本输入至预设的分类模型,得到每个样本的预测类别和预测后验概率,其中,训练集包括每个样本的真实类别,预测后验概率表示分类模型预测样本为预测类别的概率;

根据每个样本的预测后验概率,将第一预设数量的样本划分至第二预设数量的概率区间中;

统计每个概率区间内每种预测类别的样本的数量,及每个概率区间内每种预测类别的所有样本中预测正确的样本的数量,得到每个概率区间内每种预测类别的样本对应的经验后验概率,其中,经验后验概率表示每个概率区间内每种预测类别的所有样本中预测正确的样本的占比;

根据每个样本对应的预测后验概率和经验后验概率,利用第一预设算式计算第一预设数量的样本对应的概率损失值,并根据概率损失值训练分类模型。

可选的,在本发明实施例提供的一种实施方式中,第一预设算式包括:

式中,Lcal表示概率损失值,n表示第一预设数量,k表示真实类别的数量,表示预测后验概率,表示经验后验概率。

可选的,在本发明实施例提供的一种实施方式中,还包括:

根据每个样本的真实类别、预测类别及预测后验概率,利用第二预设算式计算第一预设数量的样本对应的分类损失值;

根据概率损失值训练分类模型,包括:

根据分类损失值和概率损失值训练分类模型。

进一步的,在本发明实施例提供的一种实施方式中,第二预设算式包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111487688.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top