[发明专利]基于物体真实大小和物体特征的图像识别方法和装置有效
| 申请号: | 202110506312.X | 申请日: | 2021-05-10 |
| 公开(公告)号: | CN113177498B | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 戴琼海;李晓飞 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/46;G06V10/764;G06K9/62 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 物体 真实 大小 特征 图像 识别 方法 装置 | ||
本申请提出了一种基于物体真实大小和物体特征的图像识别方法,涉及计算机图像识别技术领域,其中,该方法包括:获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。本发明可以排除匹配类别标签集中物体大小不相符的物体类别,大大缩小匹配类别的范围,提高图像识别的准确率;解决在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在要求识别的物体类别上的技术问题。
技术领域
本申请涉及计算机图像识别技术领域,尤其涉及一种基于物体真实大小和物体特征的图像识别方法和计算机设备。
背景技术
目前,人工智能领域的图像识别方法主要基于物体的形状和纹理等外观特征,比如目前经典的AlexNet、VGG、GoogleNet、ResNet、DenseNet等图像分类算法;有些基于物体所处的背景、场景等一些上下文语义信息,比如DeepLab系列模型、RefineNet、金字塔场景稀疏网络语义分割模型(PSPNet)、生成对抗网络模型(GAN)等。现有的图像识别算法无法区分汽机和汽机模型、老虎和老虎玩具等这类物体特征高度相似但物体真实大小有明显区别的图像,无法在一张多类别共存的图片或者场景中将图像识别算法的注意力集中在我们要求识别的物体类别上。
根据眼睛进化史、人类视觉识别常识和视觉系统神经网络的研究可知,物体在真实物理世界中的大小(物体真实大小)是人类识别物体的重要依据。物体真实大小的识别是一个由背侧视觉通路、腹侧视觉通路、顶叶皮质区域等脑区参与的自动识别的过程。目前人工智能领域还没有报道基于物体真实大小的图像识别方法。
发明内容
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本申请的第一个目的在于提出一种基于物体真实大小和物体特征的图像识别方法,解决了现有方法无法区分物体特征高度相似但物体真实大小有明显区别的图像的技术问题,同时解决了在识别一张多类别共存的图片或者场景时将图像识别算法的注意力集中在要求识别的物体类别上的技术问题,实现了根据物体真实大小排除匹配类别标签集中物体大小不相符的物体类别,大大缩小匹配类别的范围,提高图像识别的准确率的目的。
本申请的第二个目的在于提出一种计算机设备。
本申请的第三个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本申请第一方面实施例提出了一种基于物体真实大小和物体特征的图像识别方法,包括:S1、获取测试集和标签集,测试集包括待识别图像,标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;S2、根据对待识别图像进行图像识别后生成的多个类别标签和标签集,从多个类别标签中确定待识别图像的真实类别标签;S3、根据真实匹配类别标签生成待识别图像的识别结果,并输出识别结果。
可选地,在本申请的一个实施例中,步骤S2包括:
S211、对待识别图像中的物体进行识别,根据物体类别获取待识别图像对应的多个类别标签,并获取多个类别标签中每个类别标签对应的匹配概率;
S212、按照匹配概率从大到小的顺序从多个类别标签中提取第一个类别标签;
S213、根据提取的类别标签从标签集中确定与提取的类别标签对应的物体类别标签,并将待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较,判断待识别图像的拍摄距离是否在拍摄距离范围内;
S214、如果待识别图像的拍摄距离在拍摄距离范围内,则进一步将待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较,判断待识别图像的物体在图像中大小是否在物体在图像中大小范围内;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110506312.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种膝部约束带
- 下一篇:一种单投影仪3D成像的AR眼镜





