[发明专利]多模态目标识别方法和系统有效
| 申请号: | 202011155537.7 | 申请日: | 2020-10-26 |
| 公开(公告)号: | CN112257617B | 公开(公告)日: | 2022-05-20 |
| 发明(设计)人: | 郑丹丹 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06V40/70 | 分类号: | G06V40/70;G06V10/74;G06K9/62 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 钱孟清 |
| 地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多模态 目标 识别 方法 系统 | ||
1.一种多模态目标识别方法,包括:
在多对象场景中对每个对象进行多模态跟踪,以获取所述对象在各个模态下的模态信息;
关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集;
在所述多对象场景中选择目标;
基于所选目标确定所述目标的模态信息集;
在所述目标的模态信息集中选择可用的模态信息;以及
基于所述可用的模态信息识别所述目标。
2.如权利要求1所述的方法,所述模态信息包括:RGB图像、IR图像、3D图像、视频帧、声音、姿态、指纹、脉搏波。
3.如权利要求1所述的方法,关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集进一步包括:在所述模态信息是图像的情况下,采用图像哈希技术进行关联映射。
4.如权利要求1所述的方法,关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集进一步包括:在所述多对象场景是密集场景的情况下,采用区域交并比(IOU)和非极大值抑制(NMS)进行关联映射。
5.如权利要求1所述的方法,在所述多对象场景中选择目标包括基于空间位置来选择所述目标。
6.如权利要求1所述的方法,在所述多对象场景中选择目标包括基于场景选择所述目标。
7.如权利要求1所述的方法,在所述目标的模态信息集中选择可用的模态信息包括选择具备区分度的模态信息。
8.如权利要求1所述的方法,在所述目标的模态信息集中选择可用的模态信息包括根据不同的场景选择不同的模态信息。
9.一种多模态目标识别系统,包括:
模态信息收集模块,用于:
在多对象场景中对每个对象进行多模态跟踪,以获取每个对象在各个模态下的模态信息;
关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集;
目标选择模块,用于:
在所述多对象场景中选择目标;
基于所选目标确定所述目标的模态信息集;以及
目标识别模块,用于:
在所述目标的模态信息集中选择可用的模态信息;
基于所述可用的模态信息识别所述目标。
10.如权利要求9所述的系统,所述模态信息包括:RGB图像、IR图像、3D图像、视频帧、声音、姿态、指纹、脉搏波。
11.如权利要求9所述的系统,所述模态信息收集模块关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集进一步包括:在所述模态信息是图像的情况下,所述模态信息收集模块采用图像哈希技术进行关联映射。
12.如权利要求9所述的系统,所述模态信息收集模块关联所述对象在各个模态下的模态信息以形成所述对象的模态信息集进一步包括:在所述多对象场景是密集场景的情况下,所述模态信息收集模块采用区域交并比(IOU)和非极大值抑制(NMS)进行关联映射。
13.如权利要求9所述的系统,所述目标选择模块在所述多对象场景中选择目标包括所述目标选择模块基于空间位置来选择所述目标。
14.如权利要求9所述的系统,所述目标选择模块在所述多对象场景中选择目标包括所述目标选择模块基于场景来选择所述目标。
15.如权利要求9所述的系统,所述目标识别模块在所述目标的模态信息集中选择可用的模态信息包括所述目标识别模块选择具备区分度的模态信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011155537.7/1.html,转载请声明来源钻瓜专利网。





