[发明专利]用于检测图像中的感兴趣对象的方法和装置在审
申请号: | 201780085505.4 | 申请日: | 2017-11-07 |
公开(公告)号: | CN110235146A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | S.高希;P.阿蒙;A.胡特 | 申请(专利权)人: | 西门子股份公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/38 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 郑瑾彤;刘春元 |
地址: | 德国*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 感兴趣对象 过滤器 方法和装置 检测图像 神经网络 去卷积 输出 输入图像 堆叠 图像 学习 检测 | ||
用于检测图像中的感兴趣对象的方法和装置,该方法包括以下步骤:将至少一个输入图像提供(S1)给包括层的堆叠的经训练的深度神经网络DNN;以及使用至少一个经学习的过滤器的至少一个去卷积输出或者组合(S2)所述经训练的深度神经网络DNN的至少一个层的经学习的过滤器的去卷积输出,以检测所提供的图像中的感兴趣对象。
技术领域
本发明涉及用于检测图像中的感兴趣对象的方法和装置,并且具体地涉及使用深度神经网络来进行对象检测。
背景技术
对象检测是各种使用案例中普遍关注的问题。在比如监控或驾驶员辅助系统或自主驾驶之类的使用案例或需要关于环境的信息的任何其他使用案例中,对象检测都是很重要的任务。
发明内容
因此,本发明的目的在于提供高效地检测图像中的感兴趣对象的方法和装置。
根据本发明的第一方面,通过包括权利要求1的特征的用于检测图像中的感兴趣对象的方法来达成该目的。
根据第一方面,本发明提供了一种用于检测图像中的感兴趣对象的方法,
其中所述方法包括以下步骤:
将至少一个输入图像提供给包括层的堆叠的经训练的深度神经网络DNN,以及使用经学习的过滤器的去卷积输出或者组合所述经训练的深度神经网络DNN的至少一个层的经学习的过滤器的去卷积输出,以检测所提供的图像中的感兴趣对象。
在根据本发明第一方面的方法的可能实施例中,在包括注释标签的带注释的训练图像上训练所述深度神经网络DNN。
在根据本发明第一方面的方法的另一可能实施例中,所述带注释的训练图像的注释标签包括指示相应训练图像内的感兴趣对象的数量的计数值。
在根据本发明第一方面的方法的又一可能实施例中,基于带注释的合成训练图像和/或带注释的自然训练图像来训练所述深度神经网络DNN。
在根据本发明第一方面的方法的又一可能实施例中,组合所述经训练的深度神经网络DNN的中级和高级层的经学习的过滤器的去卷积输出,以检测所提供的图像中的感兴趣对象。
在根据本发明第一方面的方法的另一可能实施例中,所述输入图像包括具有针对不同通道的像素值的像素。
在根据本发明第一方面的方法的另一可能实施例中,所述通道包含包括针对不同颜色的像素值的颜色通道,所述不同颜色包括红色、蓝色和绿色。
在根据本发明第一方面的方法的另一可能实施例中,通过分离地处理所述不同通道来降低至少一个经学习的过滤器的至少一个去卷积输出内的噪声。
在根据本发明第一方面的方法的另一可能实施例中,保持至少一个通道而同时抑制(suppress)至少另一个通道,以降低至少一个经学习的过滤器的至少一个去卷积输出内的噪声。
在根据本发明第一方面的方法的又一可能实施例中,处理所选择的通道以提高相应通道的平均值。
在根据本发明第一方面的方法的另一可能实施例中,至少部分地通过将一层的经学习的过滤器的输出与经学习的过滤器的去卷积输出进行比较来消除所述输入图像内的背景。
在根据本发明第一方面的方法的另一可能实施例中,执行阈值处理以检测所提供的图像内的感兴趣对象的轮廓。
在根据本发明第一方面的方法的另一可能实施例中,在所述输入图像上在所检测到的轮廓周围叠加边界框,以标记所述输入图像内的感兴趣对象。
在根据本发明第一方面的方法的另一可能实施例中,存储、传输和/或显示具有所叠加的边界框的输入图像,和/或其中将所述边界框分离地储存为元数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西门子股份公司,未经西门子股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780085505.4/2.html,转载请声明来源钻瓜专利网。