[发明专利]识别对象实例和/或对象的定向的方法在审
| 申请号: | 201880060873.8 | 申请日: | 2018-08-15 |
| 公开(公告)号: | CN111149108A | 公开(公告)日: | 2020-05-12 |
| 发明(设计)人: | S.伊利克;S.扎哈洛夫 | 申请(专利权)人: | 西门子股份公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06T7/70 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 侯宇 |
| 地址: | 德国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 对象 实例 定向 方法 | ||
1.一种借助人工神经网络(CNN)在有干扰的环境(14)中识别对象实例并且确定已定位的对象(10)的定向的方法,具有步骤:
-为了获得多个样本(s),记录至少一个对象(10)的多个图像(x),所述样本包含图像数据(x)、对象身份(c)和定向(q);
-由所述样本生成训练集合(Strain)和模板集合(Sdb);
-借助所述训练集合(Strain)和损失函数(L),对所述人工神经网络(CNN)进行训练;
-通过借助所述人工神经网络分析所述模板集合(Sdb),来确定对象实例和/或对象(10)的定向,
其特征在于,
进行训练使用的损失函数(L)具有动态余量(m)。
2.根据权利要求1所述的方法,其特征在于,以如下方式由三个样本(si,sj,sk)形成三元组(38),即,第一样本(si)和第二样本(sj)来自相似的定向(q)下的相同的对象(10),其中,选择第三样本(sk),使得所述第三样本(sk)来自与所述第一样本(si)不同的对象(10),或者如果所述第三样本来自与所述第一样本(si)相同的对象(10),则所述第三样本具有与所述第一样本(si)不相似的定向(q)。
3.根据权利要求2所述的方法,其特征在于,损失函数(L)具有以下形式的三元组损失函数(Ltriplets):
其中,x表示相应的样本(si,sj,sk)的图像,f(x)表示所述人工神经网络的输出,并且m表示动态余量。
4.根据上述权利要求中任一项所述的方法,其特征在于,以如下方式由两个样本(si,sj)形成一个对,即,所述两个样本(si,sj)来自相同的对象(10)并且具有相似或者相同的定向(q),其中,所述两个样本(si,sj)在不同的图像记录条件下获得。
5.根据权利要求4所述的方法,其特征在于,损失函数(L)具有以下形式的对损失函数(Lpairs):
其中,x表示相应的样本(si,sj)的图像,并且f(x)表示人工神经的输出。
6.根据上述权利要求中任一项所述的方法,其特征在于,对象(10)的记录从多个视点(24)开始进行。
7.根据上述权利要求中任一项所述的方法,其特征在于,以如下方式进行对象(10)的记录,即,从至少一个视点(24)开始进行多次记录,其中,使照相机绕其记录轴(42)转动,以获得具有特别是四元数形式的转动信息的另外的样本(40)。
8.根据权利要求7所述的方法,其特征在于,借助相似性度量来确定两个样本之间的定向的相似性,其中,依据相似性来确定动态余量。
9.根据权利要求8所述的方法,其特征在于,以四元数的形式确定转动信息,其中,所述相似性度量具有以下形式:
θ(qi,qj)=2arccos(qi,qj),
其中,q表示作为四元数的相应的样本的定向。
10.根据权利要求9所述的方法,其特征在于,动态余量具有以下形式:
其中,q表示作为四元数的相应的样本的定向,其中,c表示对象身份。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子股份公司,未经西门子股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880060873.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:防护服用布料
- 下一篇:液体喷出头以及记录装置





