[发明专利]基于人工智能的物体检测方法、装置、设备及存储介质有效
| 申请号: | 202010281303.0 | 申请日: | 2020-04-10 |
| 公开(公告)号: | CN111476306B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 程衍华;林榆耿 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/52;G06V10/80;G06V10/82;G06N3/045;G06N3/084 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 人工智能 物体 检测 方法 装置 设备 存储 介质 | ||
1.一种基于人工智能的物体检测方法,其特征在于,所述方法包括:
将包含物体的目标图像输入物体检测模型,由所述物体检测模型对所述目标图像进行特征提取,得到多个不同尺度的特征图,基于所述多个不同尺度的特征图,确定所述物体的图像位置信息以及所述物体属于各个类别的第一置信度;
基于所述物体的图像位置信息,对所述目标图像进行截图,得到截图图像;
将所述截图图像输入物体检索模型,由所述物体检索模型将所述截图图像与多个类别的样本图像进行对比,得到所述物体属于各个类别的第二置信度;
基于所述各个类别对应的所述第一置信度以及所述第二置信度,从所述各个类别中确定所述物体的目标类别,所述目标类别对应的所述第一置信度与所述第二置信度之和最大。
2.根据权利要求1所述的方法,其特征在于,所述由所述物体检测模型对所述目标图像进行特征提取,得到多个不同尺度的特征图,包括:
通过所述物体检测模型中多个不同尺度的卷积层,依次对所述目标图像进行特征提取,得到多个不同尺度的中间特征图;
对所述多个不同尺度的中间特征图进行特征融合,得到多个不同尺度的特征图。
3.根据权利要求2所述的方法,其特征在于,所述通过所述物体检测模型中多个不同尺度的卷积层,依次对所述目标图像进行特征提取,得到多个不同尺度的中间特征图,包括:
对于所述多个不同尺度的神经网络中的任一个神经网络,获取前一个神经网络中最后一个运算层输出的第一尺度的第一中间特征图,对所述第一中间特征图进行下采样以及特征提取,得到第二尺度的第二中间特征图,所述第二尺度小于所述第一尺度。
4.根据权利要求3所述的方法,其特征在于,所述对所述多个不同尺度的中间特征图进行特征融合,得到多个不同尺度的特征图,包括:
对于任一个神经网络输出的第二尺度的第二中间特征图,获取前一个神经网络输出的第一尺度的第一中间特征图,基于所述第一尺度,对所述第二中间特征图进行上采样,得到第一尺度的第二中间特征图,对所述第一尺度的第二中间特征图和所述第一尺度的第一中间特征图进行特征融合,得到第一尺度的特征图。
5.根据权利要求4所述的方法,其特征在于,所述对所述第一尺度的第二中间特征图和所述第一尺度的第一中间特征图进行特征融合,得到第一尺度的特征图,包括:
将所述第一尺度的第二中间特征图和所述第一尺度的第一中间特征图中,相同位置的元素相加,得到所述第一尺度的特征图。
6.根据权利要求1所述的方法,其特征在于,所述基于所述多个不同尺度的特征图,确定所述物体的图像位置信息、所述物体属于各个类别的第一置信度,包括:
对于所述多个不同尺度的特征图中的任一个特征图,通过所述物体检测模型中的分类预测子网络,对所述任一个特征图进行卷积运算,得到所述目标图像对应的类别矩阵,所述类别矩阵用于指示所述目标图像中所述物体属于各个类别的第一置信度;
对于所述多个不同尺度的特征图中的任一个特征图,通过所述物体检测模型中的位置预测子网络,对所述任一个特征图进行卷积运算,得到所述目标图像对应的位置信息矩阵,所述位置信息矩阵用于指示所述目标图像中所述物体的图像位置信息。
7.根据权利要求1所述的方法,其特征在于,所述物体检索模型包括多个子检索模型,一个所述子检索模型用于将所述物体对应的截图图像与一个类别的样本图像进行对比。
8.根据权利要求7所述的方法,其特征在于,所述由所述物体检索模型将所述截图图像与多个类别的样本图像进行对比,得到所述物体属于各个类别的第二置信度,包括:
对于任一所述物体对应的截图图像,通过任一所述子检索模型,从所述一个类别的样本图像中,获取与所述截图图像之间的相似度满足目标条件的多个目标样本图像;
基于所述截图图像的图像特征以及各个类别中的所述目标样本图像的图像特征,确定所述物体属于各个类别的第二置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010281303.0/1.html,转载请声明来源钻瓜专利网。





