[发明专利]图像处理方法、计算机程序产品、存储介质及电子设备在审
| 申请号: | 202210993517.X | 申请日: | 2022-08-18 |
| 公开(公告)号: | CN115482377A | 公开(公告)日: | 2022-12-16 |
| 发明(设计)人: | 贾凡;汪天才 | 申请(专利权)人: | 北京迈格威科技有限公司 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/40;G06V10/80;G06V10/82;G06V20/56 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 董艳芳 |
| 地址: | 100090 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 处理 方法 计算机 程序 产品 存储 介质 电子设备 | ||
1.一种图像处理方法,其特征在于,包括:
获取待处理图像,并利用主干网络提取所述待处理图像的图像特征;
获取多个初始查询特征;其中,每个初始查询特征对应鸟瞰视角BEV空间中的一个子区域,所述BEV空间为所述待处理图像的拍摄范围在鸟瞰视角下对应的平面区域;
将所述多个初始查询特征输入解码网络,与同样输入所述解码网络的所述图像特征进行交互计算,得到对应的多个最终查询特征;
基于所述多个最终查询特征,利用分割网络得到对应的多个子区域内的目标分割结果;
根据所述多个子区域内的目标分割结果,得到所述BEV空间中的总体目标分割结果。
2.根据权利要求1所述的图像处理方法,其特征在于,所述获取多个初始查询特征,包括:
获取所述多个初始查询特征对应的多组坐标;其中,每组坐标至少包括x坐标和y坐标,且每个初始查询特征对应的x坐标和y坐标位于所述BEV空间中与该初始查询特征对应的子区域内;
利用查询特征编网络对所述多组坐标进行编码,得到对应的所述多个初始查询特征;其中,一个初始查询特征的维度大于一组坐标的维度。
3.根据权利要求2所述的图像处理方法,其特征在于,每组坐标还包括通过学习得到的z坐标。
4.根据权利要求2或3所述的图像处理方法,其特征在于,所述查询特征编码网络包括位置编码器和特征编码器,所述利用查询特征编网络对所述多组坐标进行编码,得到对应的所述多个初始查询特征,包括:
利用所述位置编码器对所述多组坐标进行编码,得到对应的多个位置编码特征;其中,一个位置编码特征的维度大于一组坐标的维度;
利用所述特征编码器对所述多个位置编码特征进行编码,得到对应的所述多个初始查询特征;其中,所述特征编码器为多层感知机。
5.根据权利要求1-4中任一项所述的图像处理方法,其特征在于,所述基于所述多个最终查询特征,利用分割网络得到对应的多个子区域内的目标分割结果,包括:
将所述多个最终查询特征输入所述分割网络,得到对应的多组离散余弦变换DCT系数;
对所述多组DCT系数进行逆向离线余弦变换IDCT,得到对应的多个子区域内的目标分割结果。
6.根据权利要求1-5中任一项所述的图像处理方法,其特征在于,所述解码网络包括依次连接的至少一个解码器,每个解码器用于对输入该解码器的多个查询特征进行解码,并输出多个解码后的查询特征,输入第一个解码器的多个查询特征为所述多个初始查询特征,最后一个解码器输出的多个解码后的查询特征为所述多个最终查询特征;
其中,每个解码器均包括自注意力层和交叉注意力层,每个解码器在进行解码时,所述自注意力层用于对输入该解码器的多个查询特征进行交互计算,所述交叉注意力层用于将所述自注意力层输出的多个查询特征与所述图像特征进行交互计算。
7.根据权利要求1-6中任一项所述的图像处理方法,其特征在于,所述待处理图像为多帧图像,其中的每帧图像对应一个视角,并由安装在移动载体上的一个摄像头采集,且所述多帧图像的总体拍摄范围覆盖所述移动载体的四周。
8.一种计算机程序产品,其特征在于,包括计算机程序指令,所述计算机程序指令被处理器读取并运行时,执行如权利要求1-7中任一项所述的方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器读取并运行时,执行如权利要求1-7中任一项所述的方法。
10.一种电子设备,其特征在于,包括:存储器以及处理器,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器读取并运行时,执行权利要求1-7中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京迈格威科技有限公司,未经北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210993517.X/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





