[发明专利]一种目标检测方法、装置、计算设备及介质有效
申请号: | 201811627994.4 | 申请日: | 2018-12-28 |
公开(公告)号: | CN111402191B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 陈云;吴正芳;陈均炫 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/82;G06V10/40;G06N3/0464;G06N3/084 |
代理公司: | 北京成创同维知识产权代理有限公司 11449 | 代理人: | 刘静 |
地址: | 开曼群岛大开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 方法 装置 计算 设备 介质 | ||
1.一种目标检测方法,包括:
将待检测的图像输入到目标检测模型,应用所述目标检测模型对所述图像进行目标检测,其中,所述图像为三维图像;
获取所述目标检测模型的输出结果,所述输出结果包括所述图像中目标区域的位置信息;
其中,所述目标检测模型包括三维卷积神经网络、区域候选网络、特征提取层、区域筛查网络和掩码预测网络,所述将待检测的图像输入到目标检测模型,应用所述目标检测模型对所述图像进行目标检测,包括:
将待检测的图像输入到所述三维卷积神经网络中进行处理,以获取所述图像的一个或多个三维特征图;
将所述图像的三维特征图输入到所述区域候选网络中进行处理,以确定所述三维特征图中是否含有疑似目标区域;
将含有疑似目标区域的三维特征图输入到所述特征提取层,以提取出所述含有疑似目标区域的三维特征图的图像特征;
将所述图像特征输入到所述区域筛查网络中进行处理,以确定所述疑似目标区域是否为目标区域;
若所述疑似目标区域为目标区域,则通过所述区域筛查网络和掩码预测网络预测所述目标区域的位置信息。
2.如权利要求1所述的方法,所述目标区域的位置信息包括所述目标区域的位置坐标和三维轮廓信息。
3.如权利要求1或2所述的方法,其中,所述三维卷积神经网络分别与所述区域候选网络和所述特征提取层相连;
所述特征提取层还分别与所述区域筛查网络和所述掩码预测网络相连;
所述目标检测模型以所述三维卷积神经网络为输入端,以所述区域筛查网络和所述掩码预测网络为输出端。
4.如权利要求1所述的方法,所述通过所述区域筛查网络和掩码预测网络预测所述目标区域的位置信息,包括:
通过所述区域筛查网络确定所述目标区域的位置坐标;
通过所述掩码预测网络预测所述目标区域的三维轮廓信息。
5.如权利要求1所述的方法,其中,所述将含有疑似目标区域的三维特征图输入到所述特征提取层,以提取出所述含有疑似目标区域的三维特征图的图像特征,包括:
将含有疑似目标区域的三维特征图输入到所述特征提取层,以计算出所述疑似目标区域在其对应的三维特征图中的位置;
通过三线性插值,将所述疑似目标区域形成一个对应的特征张量,将所述特征张量作为所述含有疑似目标区域的三维特征图的图像特征。
6.如权利要求3所述的方法,其中,所述三维卷积神经网络包括多个卷积处理层,所述卷积处理层包括依次相连的卷积层或转置卷积层、批标准化层和激活层。
7.如权利要求3所述的方法,所述区域筛查网络包括一个或多个卷积层、一个或多个全连接层、分类器和坐标输出层,其中:
所述区域筛查网络以一个卷积层为输入端,以所述分类器和坐标输出层为输出端;
所述分类器的输出指示输入所述区域筛查网络的疑似目标区域是否为目标区域;
所述坐标输出层指示在输入所述区域筛查网络的疑似目标区域为目标区域时,所述疑似目标区域的位置坐标。
8.如权利要求3所述的方法,其中,所述目标检测模型基于预先获取的图像数据集合进行模型训练,以便所述区域筛查网络和掩码预测网络输出输入图像中目标区域的位置信息。
9.如权利要求8所述的方法,其中,所述图像数据集合包括多条图像训练数据,每条图像训练数据包括三维训练图像,以及所述三维训练图像包括的目标区域的位置信息,所述基于预先获取的图像数据集合进行模型训练,包括:
将所述图像训练数据中的三维训练图像作为输入,输入到所述目标检测模型,以得到所述目标检测模型输出的所述三维训练图像的检测结果;
基于所述三维训练图像包括的目标区域的位置信息和所述检测结果之间的差异,调整所述目标检测模型的网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811627994.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:太阳电池互联结构
- 下一篇:媒体文件播放方法和媒体文件播放装置