[发明专利]目标检测与目标检测模型的训练方法、装置在审
申请号: | 202210082040.X | 申请日: | 2022-01-24 |
公开(公告)号: | CN114549926A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 王康康 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774;G06V10/40;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京鸿德海业知识产权代理有限公司 11412 | 代理人: | 田宏宾 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 模型 训练 方法 装置 | ||
本公开提供了一种目标检测与目标检测模型的训练方法、装置、电子设备及可读存储介质,涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于图像处理、图像检测等场景。其中,目标检测方法包括:获取待处理图像;使用与预设方向对应的非中心化卷积核,从所述待处理图像中提取图像特征;根据所述图像特征,得到所述待处理图像的目标检测结果。目标检测模型的训练方法包括:获取训练集;构建包含输入网络、特征提取网络与输出网络的神经网络模型;使用所述多张样本图像与多张样本图像的目标标注结果训练所述神经网络模型,以调整所述神经网络模型中各网络的参数、以及所述与预设方向对应的非中心化卷积核的参数,得到目标检测模型。
技术领域
本公开涉及人工智能技术领域,具体为深度学习、计算机视觉技术领域,可应用于图像处理、图像检测等场景。具体提供了一种目标检测与目标检测模型的训练方法、装置、电子设备及可读存储介质。
背景技术
在对图像进行目标检测时,参考所检测目标的上下文特征能够提升检测效果。例如在目标检测中,对于人脸检测来说,头肩和人体就属于上下文特征,参考头肩和人体的位置会十分有利于人脸检测。
在现有技术中,通常采用以下两种方式来实现参考上下文特征进行目标检测:1)直接扩大感受野;2)显示地结合上下文特征,但是上述两种方法存在引入大量的无关背景、标注成本较高的问题。
发明内容
根据本公开的第一方面,提供了一种目标检测方法,包括:获取待处理图像;使用与预设方向对应的非中心化卷积核,从所述待处理图像中提取图像特征;根据所述图像特征,得到所述待处理图像的目标检测结果。
根据本公开的第二方面,提供了一种目标检测模型的训练方法,包括:获取训练集,所述训练集中包含多张样本图像与多张样本图像的目标标注结果;构建包含输入网络、特征提取网络与输出网络的神经网络模型,所述输入网络用于将样本图像输入所述特征提取网络,所述特征提取网络包含至少一个目标特征提取层,所述至少一个目标特征提取层用于根据前一层输出的图像特征、以及与预设方向对应的非中心化卷积核,得到图像特征,所述输出网络用于根据所述特征提取网络输出的图像特征,得到样本图像的目标预测结果;使用所述多张样本图像与多张样本图像的目标标注结果训练所述神经网络模型,以调整所述神经网络模型中各网络的参数、以及所述与预设方向对应的非中心化卷积核的参数,得到目标检测模型。
根据本公开的第三方面,提供了一种目标检测装置,包括:第一获取单元,用于获取待处理图像;处理单元,用于使用与预设方向对应的非中心化卷积核,从所述待处理图像中提取图像特征;检测单元,用于根据所述图像特征,得到所述待处理图像的目标检测结果。
根据本公开的第四方面,提供了一种目标检测模型的训练装置,包括:第二获取单元,用于获取训练集,所述训练集中包含多张样本图像与多张样本图像的目标标注结果;构建单元,用于构建包含输入网络、特征提取网络与输出网络的神经网络模型,所述输入网络用于将样本图像输入所述特征提取网络,所述特征提取网络包含至少一个目标特征提取层,所述至少一个目标特征提取层用于根据前一层输出的图像特征、以及与预设方向对应的非中心化卷积核,得到图像特征,所述输出网络用于根据所述特征提取网络输出的图像特征,得到样本图像的目标预测结果;训练单元,用于使用所述多张样本图像与多张样本图像的目标标注结果训练所述神经网络模型,以调整所述神经网络模型中各网络的参数、以及所述与预设方向对应的非中心化卷积核的参数,得到目标检测模型。
根据本公开的第五方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方法。
根据本公开的第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行如上所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210082040.X/2.html,转载请声明来源钻瓜专利网。