[发明专利]对象属性识别方法、装置、可读存储介质及电子设备在审
申请号: | 202210074401.6 | 申请日: | 2022-01-21 |
公开(公告)号: | CN114429552A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 毛晓飞;黄灿 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/764;G06K9/62;G06V40/10;G06V20/62 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贾会玲 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对象 属性 识别 方法 装置 可读 存储 介质 电子设备 | ||
本公开涉及一种对象属性识别方法、装置、可读存储介质及电子设备。方法包括:获取目标图像,目标图像中包含目标对象和目标对象的对象描述信息;从目标图像中提取目标对象的关键信息特征序列和目标对象的目标属性对应的多模态特征序列,多模态特征序列包括目标属性的视觉特征序列和语义特征序列;根据关键信息特征序列和多模态特征序列,确定目标对象的多个对象属性。这样,在对目标图像中的目标对象进行属性识别时,不但参考了目标对象的关键信息特征,还参考目标属性的视觉特征和语义特征,使得目标对象的特征维度更加丰富,信息更加全面,从而提升了对象属性识别的准确度和对象属性的丰富度。
技术领域
本公开涉及图像处理技术领域,具体地,涉及一种对象属性识别方法、装置、可读存储介质及电子设备。
背景技术
近年来,随着信息化技术的快速发展,图像结构化己成为图像理解中的标配。图像结构化是一种基于图像内容信息提取关键目标对象(例如,车辆、行人等)的技术,它对图像内容按照语义关系,采用时空分割、特征提取、对象识别等处理手段,组织成可供计算机和人类理解的结构化信息的技术。其中,对图像中对象的属性进行识别是图像结构化重要的一个功能模块,其能够从图像中预测对象的各个属性标签,如行人的年龄、性别和服装款式等,车辆的车牌号,年限等,其可用于图像感知世界的智慧应用。其中,如何提升图像的对象属性识别的准确度和丰富度,成为增强图像理解的关键。
发明内容
提供该发明内容部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种对象属性识别方法,包括:
获取目标图像,其中,所述目标图像中包含目标对象和所述目标对象的对象描述信息;
从所述目标图像中提取所述目标对象的关键信息特征序列和所述目标对象的目标属性对应的多模态特征序列,其中,所述多模态特征序列包括所述目标属性的视觉特征序列和语义特征序列;
根据所述关键信息特征序列和所述多模态特征序列,确定所述目标对象的多个对象属性,其中,所述多个对象属性包括所述目标属性。
第二方面,本公开提供一种对象属性识别装置,包括:
获取模块,用于获取目标图像,其中,所述目标图像中包含目标对象和所述目标对象的对象描述信息;
第一提取模块,用于从所述获取模块获取到的所述目标图像中提取所述目标对象的关键信息特征序列和所述目标对象的目标属性对应的多模态特征序列,其中,所述多模态特征序列包括所述目标属性的视觉特征序列和语义特征序列;
确定模块,用于根据所述第一提取模块提取到的所述关键信息特征序列和所述多模态特征序列,确定所述目标对象的多个对象属性,其中,所述多个对象属性包括所述目标属性。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面提供的所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有计算机程序;
处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面提供的所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210074401.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:内窥镜图像的处理方法、装置、可读介质和电子设备
- 下一篇:一种基片转运装置