[发明专利]基于关系推理的自监督学习模型训练方法和装置有效
申请号: | 201910146820.4 | 申请日: | 2019-02-27 |
公开(公告)号: | CN109886345B | 公开(公告)日: | 2020-11-13 |
发明(设计)人: | 鲁继文;周杰;陈志祥 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08;G06N5/04 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关系 推理 监督 学习 模型 训练 方法 装置 | ||
1.一种基于关系推理的自监督学习模型训练方法,其特征在于,包括以下步骤:
获取样本图片集,对所述样本图片集中的每个样本图片采用选定的几何变换操作进行几何变换,以确定每个样本图片对应的不同局部观察图片;
将每张图片对应的不同局部观察图片输入初始学习模型,得到相应图片对应的不同局部观察图片的局部特征;
将相应图片对应的不同局部观察图片的局部特征进行融合,得到相应图片的全局特征;
针对每张图片,确定相应图片对应的不同局部观察图片的局部特征和所述相应图片的全局特征之间的预测几何变换关系,根据所述预测几何变换关系和相应局部观察图片对应的实际几何变换关系之间的差异,构建所述学习模型的损失函数;
根据所述学习模型的损失函数,对所述学习模型进行修正,确定所述学习模型对应的目标参数,以生成所述学习模型。
2.根据权利要求1所述的一种基于关系推理的自监督学习模型训练方法,其特征在于,所述对所述样本图片集中的每个样本图片采用选定的几何变换操作进行几何变换,以确定每个样本图片对应的不同局部观察图片,包括:
根据选取的几何变换操作,对样本图片集中的每张图片分别进行几何变换操作,得到每个图片对应不同几何变换操作的局部观察图片gj(xi),其中,xi代表第i个图片,取值为[1,2,…n],gj代表第j个几何变换操作,取值为[1,2,…m]。
3.根据权利要求2所述的学习模型训练方法,其特征在于,所述将相应图片对应的不同局部观察图片的局部特征进行融合,得到相应图片的全局特征,包括:
将每张图片对应的不同局部观察图片的局部特征进行融合,得到相应图片的全局特征Ri,Ri=max(F(gj(xi))),其中,F(gj(xi))为每张图片对应的不同局部观察图片的局部特征,max()函数表示执行按位融合操作。
4.根据权利要求3所述的学习模型训练方法,其特征在于,所述针对每张图片,确定相应图片对应的不同局部观察图片的局部特征和所述相应图片的全局特征之间的预测几何变换关系,根据所述预测几何变换关系和相应局部观察图片对应的实际几何变换关系之间的差异,构建所述学习模型的损失函数,包括:
针对每张图片对应的每一个局部观察图片,利用预测模块,预测相应局部观察图片的局部特征和相应图片的全局特征之间对应的预测几何变换关系Φ(F(gj(xi)),Ri);
根据所述预测几何变换关系和相应局部观察图片对应的实际几何变换关系之间的差异,通过评估函数构建相应图片对应的损失函数loss(Φ(F(gj(xi)),Ri),lj),其中,lj为相应局部观察图片对应的实际几何变换关系,用于指示输入的局部观察图片的几何变换操作是否是第j个几何变换操作gj;
将样本图片集中的所有图片对应的损失函数累加,得到模型的损失函数。
5.根据权利要求1-4任一所述的模型训练方法,其特征在于,所述根据所述学习模型的损失函数,对所述学习模型进行修正,确定所述学习模型对应的目标参数,以生成所述学习模型,包括:
根据随机梯度下降法持续更新局部特征;
根据更新的局部特征,更新对应的全局特征,迭代求解确定最小化的目标损失函数和模型的目标参数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910146820.4/1.html,转载请声明来源钻瓜专利网。