[发明专利]分类模型校准在审
| 申请号: | 202110539506.X | 申请日: | 2021-05-18 |
| 公开(公告)号: | CN113723438A | 公开(公告)日: | 2021-11-30 |
| 发明(设计)人: | 张丹;K·帕特尔;W·H·贝鲁奇 | 申请(专利权)人: | 罗伯特·博世有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 任一方;周学斌 |
| 地址: | 德国斯*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 分类 模型 校准 | ||
1.一种对训练分类模型进行校准的计算机实现的方法(500),所述训练分类模型被训练成根据多个类对输入样本进行分类并提供相关联的预测概率,所述训练分类模型包括多个隐藏层和至少一个激活层,所述方法包括:
-访问(510)训练分类模型;
-访问(510)多个验证样本,每个验证样本具有基础真值标签,所述基础真值标签指示基础真值类;
-将训练分类模型应用(520)于所述多个验证样本;
-对于每个验证样本,从在最后激活层之前的训练分类模型的层获得(530)输出对数几率向量;
-训练(540)用于调整预测概率的校准模块,预测概率从输出对数几率向量导出,校准模块包括用于通过微调输出对数几率向量来调整预测概率的微调子模块和用于通过分级输出对数几率向量来调整预测概率的分级子模块中的至少一个;和
其中对校准模块进行训练包括训练(550)微调模型,其中微调模型的模型参数由以下各项确定:
-对于所述多个验证样本中的每个验证样本:
-从输出对数几率向量确定(552)基础真值概率,基础真值概率是与所述验证样本的基础真值类相关联的预测概率,
-从输出对数几率向量确定(553)锚定概率,所述锚定概率是不正确类的最高概率,以及
-通过从锚定概率减去基础真值概率来确定(554)预测难度;
-通过使在所述多个验证样本之上取平均的微调损失函数最小化来确定(555)微调模型的模型参数,微调损失函数包括基于每个验证样本的预测难度的调制项,确定的模型参数定义了训练微调模型;和
-将训练微调模型存储(556)在校准模块中;和
-将训练校准模块附加(570)到训练分类模型,以获得校准的分类模型。
2.根据权利要求1所述的方法,其中所述校准模块包括分级子模块,所述分级子模块包括定义仓边界和仓代表的分级方案,并且其中对校准模块进行训练包括通过以下各项确定(560)分级方案:
-对于每个验证样本,将输出对数几率向量转换(562)成二进制分类集,每个二进制分类包括二进制标签()和相关联的标量对数几率();
-通过使分级损失函数最小化来确定(563)仓边界,使分级损失函数最小化相当于使在量化的标量对数几率和与所述量化的标量对数几率相关联的二进制标签之间的互信息最大化,通过更新仓边界和辅助变量集来使分级损失函数最小化,其中量化的标量对数几率根据分级方案被量化;
-将标量对数几率量化(564)到由确定的仓边界定义的仓中;
-对于每个仓确定(565)用于表示所述仓中的量化的标量对数几率的仓代表值;和
-在校准模块中存储(566)定义确定的分级方案的仓边界和仓代表。
3.根据权利要求2所述的方法,其中使分级损失函数最小化包括通过使用梯度下降和封闭形式计算中的至少一个来更新仓边界和辅助变量中的至少一个。
4.根据权利要求2或权利要求3所述的方法,其中确定每个仓的仓代表包括确定其对应标量对数几率落入所述仓内的验证样本的比例,验证样本的比例具有相同的基础真值标签,以及将所述仓的仓代表设置为对应于确定的比例的预测概率。
5.根据权利要求2至权利要求4中任一项所述的方法,其中将输出对数几率向量转换成二进制分类集包括以下各项中的一个:
-使用前
-使用逐类校准来校准对于所述多个类中的每个类的预测;和
-使用共享的逐类校准来校准对于所述多个类中的每个类的预测。
6.根据任一前述权利要求所述的方法,其中所述微调损失函数包括负对数似然函数、Brier评分函数和合页损失函数中的至少一个。
7.根据任一前述权利要求所述的方法,其中所述微调损失函数基于参数模型,诸如矩阵缩放模型和/或狄利克雷校准模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110539506.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:加工装置
- 下一篇:基板处理装置和基板处理方法





