[发明专利]定位模型的训练和定位方法、装置、设备以及存储介质在审
申请号: | 201911328397.6 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111080694A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 周康明;于洋 | 申请(专利权)人: | 上海眼控科技股份有限公司 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06K9/32 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨俊辉;臧建明 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 定位 模型 训练 方法 装置 设备 以及 存储 介质 | ||
本申请实施例提供一种定位模型的训练方法,该方法包括:将预先获取的图形样本输入初始定位模型,图形样本携带有预设的至少一个定位目标的坐标标签,每个坐标标签标记了每个定位目标的多个顶点的坐标,并预测得到至少一个定位目标的定位信息,定位信息包括多个顶点坐标,再根据至少一个定位目标的定位信息和坐标标签,确定损失函数的最小值,根据损失函数对初始定位模型进行训练,直至损失函数的最小值小于预设值,得到定位模型,本发明采用标签无序化的方法,初始定位模型进行训练,得到定位模型,降低了模型的学习难度,加快了损失函数的收敛速度,缩短了训练时间。
技术领域
本申请实施例涉及计算机技术,尤其涉及一种定位模型的训练和定位方法、装置、设备以及存储介质。
背景技术
在计算机技术领域,常使用定位模型对图像中的图形进行定位,而为了使定位模型输出的定位结果更加准确,常常通过损失函数对定位模型进行训练。
目前,在很多定位模型中,采取的是标签对齐的方式,设置定位模型预测的顶点的顺序和预设的坐标标签的顺序一致,即让每个顶点的预测坐标和该点的坐标标签对应,然后将对应的预测坐标和坐标标签作为参数,求取损失函数(loss function),通过训练定位模型,使损失函数不断收敛。
然而,使图形中每个顶点的预测坐标和该点的坐标标签对应起来计算损失函数,增加了定位模型的训练难度,且训练时间较长。
发明内容
本申请实施例提供一种定位模型的训练和定位方法、装置、设备以及存储介质,以克服定位模型训练难度大、时间长的问题。
第一方面,本发明实施例提供一种定位模型的训练方法,包括:
将预先获取的图形样本输入初始定位模型;所述图形样本携带有预设的至少一个定位目标的坐标标签,每个坐标标签标记了每个定位目标的多个顶点的坐标;
预测得到所述至少一个定位目标的定位信息,所述定位信息包括多个顶点坐标;
根据所述至少一个定位目标的定位信息和坐标标签,确定损失函数的最小值;
根据所述损失函数对所述初始定位模型进行训练,直至损失函数的最小值小于预设值,得到所述定位模型。
进一步地,所述根据所述至少一个定位目标的定位信息和坐标标签,确定损失函数的最小值,包括:
将所述定位信息的多个顶点坐标与所述坐标标签的多个顶点的坐标逐个组合,得到所述损失函数的多组参数;
针对每组参数,计算得到多个损失函数值,并获取所述多个损失函数值中的最小值。
在一种具体的实现方式中,若所述至少一个定位目标为四边形,则所述损失函数为:
其中,为预测得到的所述定位信息的四个顶点坐标,为所述坐标标签的四个顶点的坐标,Pos为所述图形样本中检测得到的至少一个定位目标的集合,为匹配指示矩阵中的系数,smoothL1为平滑L1损失函数。
可选的,所述方法还包括:
根据所述定位信息,将所述坐标标签中每个顶点的坐标转换为相对坐标;所述定位信息包括包围盒的中心点坐标,所述包围盒为根据所述图形样本中的图形生成的矩形框。
第二方面,本发明实施例提供一种四边形顶点相对位置确定方法,所述方法包括:
将待定位的目标图形输入定位模型,获取所述目标图形中每个定位目标的四个顶点坐标;
根据所述四个顶点坐标和预设置的坐标系,确定所述定位目标的定位信息,所述定位信息包括每个顶点的坐标和顶点位置;所述四个顶点坐标均处于所述预设置的坐标系的x轴正半轴和y轴正半轴。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海眼控科技股份有限公司,未经上海眼控科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911328397.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:喷油装置
- 下一篇:一种设置全息防伪标识的证卡及其制作方法