[发明专利]一种样本选择模型的确定方法及装置在审
| 申请号: | 201910787004.1 | 申请日: | 2019-08-24 |
| 公开(公告)号: | CN112434073A | 公开(公告)日: | 2021-03-02 |
| 发明(设计)人: | 杜森垚 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06N20/00 |
| 代理公司: | 北京嘉科知识产权代理事务所(特殊普通合伙) 11687 | 代理人: | 杨波 |
| 地址: | 100086 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 样本 选择 模型 确定 方法 装置 | ||
1.一种样本选择模型的确定方法,包括:
获取目标计算模型和已标注的样本数据集合;并获取多个样本选择模型;
利用各所述样本选择模型对所述已标注的样本数据集合进行选择,得到相应的已标注样本子集合;
基于所述目标计算模型及所述各已标注样本子集合,确定所述已标注样本子集合各自对应的评价结果;
根据所述评价结果,从所述多个样本选择模型中确定优选样本选择模型。
2.根据权利要求1所述方法,所述基于所述目标计算模型及所述各已标注样本子集合,确定所述已标注样本子集合各自对应的评价结果包括:
利用所述目标计算模型对所述各已标注样本子集合进行计算,得到模型输出结果;
获取所述已标注样本子集合的标注信息;
根据所述模型输出结果,以及所述已标注样本子集合的标注信息,确定所述已标注样本子集合各自对应的评价结果。
3.根据权利要求2所述方法,所述根据所述模型输出结果,以及所述已标注样本子集合的标注信息,确定所述已标注样本子集合各自对应的评价结果包括:
确定所述模型输出结果以及所述已标注样本子集合的标注信息之间的损失函数,根据所述损失函数确定所述标记样本子集合各自对应的评价结果。
4.根据权利要求3所述方法,所述根据所述评价结果,从所述多个样本选择模型中确定优选样本选择模型包括:
将所述损失函数的最大值对应的评价结果,确定为优选评价结果;
将所述优选评价结果相应的样本选择模型确定为所述优选样本选择模型。
5.根据权利要求1~4任意一项所述方法,还包括:
利用所述优选样本选择模型对未标注的样本数据集合进行选择,得到未标注样本子集合;
基于所述未标注样本子集合对所述目标计算模型进行模型训练。
6.一种样本选择模型的确定装置,包括:
获取模块,用于获取目标计算模型和已标注的样本数据集合;并获取多个样本选择模型;
样本选择模块,用于利用各所述样本选择模型对所述已标注的样本数据集合进行选择,得到相应的已标注样本子集合;
评价结果确定模块,用于基于所述目标计算模型及所述各已标注样本子集合,确定所述已标注样本子集合各自对应的评价结果;
优选样本选择模型确定模块,用于根据所述评价结果,从所述多个样本选择模型中确定优选样本选择模型。
7.根据权利要求6所述装置,所述评价结果确定模块包括:
模型输出计算单元,用于利用所述目标计算模型对所述各已标注样本子集合进行计算,得到模型输出结果;
已标注样本子集合获取单元,用于获取所述已标注样本子集合的标注信息;
损失函数确定单元,用于确定所述模型输出结果以及所述已标注样本子集合的标注信息之间的损失函数;
损失函数计算单元,用于根据所述损失函数确定所述标记样本子集合各自对应的评价结果。
8.根据权利要求7所述装置,所述优选样本选择模型确定模块包括:
优选评价结果确定单元,用于将所述损失函数的最大值对应的评价结果,确定为优选评价结果;
优选样本选择模型确定单元,用于将所述优选评价结果相应的样本选择模型确定为所述优选样本选择模型。
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-5任一所述的样本选择模型的确定方法。
10.一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-5任一所述的样本选择模型的确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910787004.1/1.html,转载请声明来源钻瓜专利网。





