[发明专利]可转换模式的基于R-CNN的用于监视的方法和装置有效
| 申请号: | 201911055354.5 | 申请日: | 2019-10-31 |
| 公开(公告)号: | CN111488871B | 公开(公告)日: | 2023-08-04 |
| 发明(设计)人: | 金桂贤;金镕重;金寅洙;金鹤京;南云铉;夫硕焄;成明哲;吕东勋;柳宇宙;张泰雄;郑景中;诸泓模;赵浩辰 | 申请(专利权)人: | 斯特拉德视觉公司 |
| 主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06N3/082;G06N3/0464;G06N3/084 |
| 代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 金美莲 |
| 地址: | 韩国庆*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 转换 模式 基于 cnn 用于 监视 方法 装置 | ||
1.一种学习方法,用于学习基于R-CNN的对象检测器,其特征在于,包括以下步骤:
(a)学习装置使至少一个卷积层对至少一个训练图像执行至少一次卷积运算,以输出至少一个特征映射,并且使区域建议网络(i)在所述特征映射上利用多个锚框生成与在所述训练图像中推定存在至少一个对象的候选区域对应的候选感兴趣区域,所述多个锚框由尺度和纵横比中的至少一部分来区分;(ii)将判断为所述对象存在的概率高的特定候选感兴趣区域作为感兴趣区域建议来输出;
(b)所述学习装置(i)将所述感兴趣区域建议输入到与各池化尺寸相对应的各池化层,所述各池化尺寸与用于生成所述感兴趣区域建议的各特定锚框相对应地设定;(ii)使所述各池化层根据与其对应的池化尺寸在所述特征映射上池化与所述感兴趣区域建议对应的区域,并输出与其对应的特征向量;(iii)使与所述各池化层对应的各全连接层利用各所述特征向量来输出与各所述感兴趣区域建议对应的各对象类别信息和各对象回归信息;以及
(c)所述学习装置使与所述各全连接层对应的各对象损失层参考所述各对象类别信息和所述各对象回归信息以及与其对应的各对象地面实况来计算各对象类别损失和各对象回归损失,并通过利用所述各对象类别损失和所述各对象回归损失的反向传播来学习所述各全连接层和所述卷积层。
2.根据权利要求1所述的学习方法,其特征在于,
所述学习装置使区域建议网络损失层参考(i)所述候选感兴趣区域的感兴趣区域类别信息和感兴趣区域回归信息以及(ii)与其对应的各感兴趣区域地面实况,计算各感兴趣区域类别损失和各感兴趣区域回归损失,
所述学习装置通过执行利用所述各感兴趣区域类别损失和所述各感兴趣区域回归损失的反向传播来学习所述区域建议网络。
3.根据权利要求2所述的学习方法,其特征在于,
所述学习装置分开执行(i)利用所述各对象类别损失和所述各对象回归损失的反向传播和(ii)利用所述各感兴趣区域类别损失和所述各感兴趣区域回归损失的反向传播。
4.根据权利要求1所述的学习方法,其特征在于,
在所述步骤(a)之前,
所述学习装置处于已完成下述处理的状态,所述处理通过利用各感兴趣区域类别损失和各感兴趣区域回归损失的反向传播来学习所述区域建议网络,所述各感兴趣区域类别损失和各感兴趣区域回归损失是分别参考(i)所述候选感兴趣区域的感兴趣区域类别信息和感兴趣区域回归信息、以及(ii)与其对应的感兴趣区域地面实况来计算出的。
5.根据权利要求1所述的学习方法,其特征在于,
所述各池化尺寸与所述特定锚框的所述纵横比对应。
6.根据权利要求1所述的学习方法,其特征在于,
所述各池化尺寸与所述特定锚框的所述尺度对应。
7.根据权利要求1所述的学习方法,其特征在于,
所述各池化尺寸与要检测的所述对象的形状对应。
8.根据权利要求1所述的学习方法,其特征在于,
所述各池化尺寸与所述特定锚框各自的尺寸对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯特拉德视觉公司,未经斯特拉德视觉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911055354.5/1.html,转载请声明来源钻瓜专利网。





