[发明专利]基于物体真实大小和物体特征的图像识别方法和装置有效
| 申请号: | 202110506312.X | 申请日: | 2021-05-10 |
| 公开(公告)号: | CN113177498B | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 戴琼海;李晓飞 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/46;G06V10/764;G06K9/62 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 物体 真实 大小 特征 图像 识别 方法 装置 | ||
1.一种基于物体真实大小和物体特征的图像识别方法,其特征在于,包括以下步骤:
S1、获取测试集和标签集,所述测试集包括待识别图像,所述标签集中包括预存的各物体类别标签,与拍摄距离范围和物体在图像中大小范围之间的对应关系;
S2、根据对所述待识别图像进行图像识别后生成的多个类别标签和所述标签集,从多个类别标签中确定所述待识别图像的真实类别标签;
S3、根据所述真实类别标签生成所述待识别图像的识别结果,并输出所述识别结果;
其中,所述步骤S2包括步骤S211-步骤S215:
S211、对所述待识别图像中的物体进行识别,根据物体类别获取所述待识别图像对应的多个类别标签,并获取所述多个类别标签中每个类别标签对应的匹配概率;
S212、按照所述匹配概率从大到小的顺序从所述多个类别标签中提取第一个类别标签;
S213、根据提取的类别标签从所述标签集中确定与提取的类别标签对应的物体类别标签,并将所述待识别图像的拍摄距离与确定的物体类别标签对应的拍摄距离范围进行比较,判断所述待识别图像的拍摄距离是否在拍摄距离范围内;
S214、如果所述待识别图像的拍摄距离在拍摄距离范围内,则进一步将所述待识别图像的物体在图像中大小与确定的物体类别标签对应的物体在图像中大小范围进行比较,判断所述待识别图像的物体在图像中大小是否在物体在图像中大小范围内;
S215、如果所述待识别图像的物体在图像中大小在物体在图像中大小范围内,则将确定的物体类别标签作为所述待识别图像的真实类别标签;或者
所述步骤S2包括步骤S221-步骤S226:
S221、将所述待识别图像的拍摄距离和物体在图像中大小与所述标签集中的拍摄距离范围和物体在图像中大小范围进行比较,判断所述待识别图像的拍摄距离和物体在图像中大小所属的拍摄距离范围和物体在图像中大小范围;
S222、获取所属的拍摄距离范围和物体在图像中大小范围对应的物体类别标签,根据物体类别标签和拍摄距离范围和物体在图像中大小范围对应的物体类别标签生成子标签集;
S223、对所述待识别图像中的物体进行识别,根据物体类别获取所述待识别图像对应的多个类别标签,并获取所述多个类别标签中每个类别标签对应的匹配概率;
S224、按照所述匹配概率从大到小的顺序从所述多个类别标签中提取第一个类别标签;
S225、判断提取的类别标签是否与所述子标签集中的物体类别标签匹配;
S226、如果提取的类别标签与所述子标签集中的物体类别标签匹配,则将匹配的物体类别标签确定为所述待识别图像的真实类别标签。
2.如权利要求1所述的识别方法,其特征在于,在所述步骤S213之后,所述识别方法还包括:
如果所述待识别图像的拍摄距离不在拍摄距离范围内,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215;
在所述步骤S214之后,所述识别方法还包括:
如果所述待识别图像的物体在图像中大小不在物体在图像中大小范围内,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S213-215。
3.如权利要求1所述的识别方法,其特征在于,在所述步骤S224之后,所述识别方法还包括:
如果提取的类别标签与所述子标签集中的物体类别标签不匹配,则从所述多个类别标签中提取第二个类别标签,并根据提取的第二个类别标签重复进行上述步骤S225-226。
4.如权利要求1-3任一项所述的识别方法,其特征在于,所述标签集中各物体类别标签与拍摄距离范围和物体在图像中大小范围之间的对应关系,是预先由人工计算并标注的,或者,通过各物体的拍摄距离和图像中大小实时测量得到的。
5.如权利要求1-3任一项所述的识别方法,其特征在于,所述物体在图像中大小通过物体在图像中的高度和宽度表示。
6.如权利要求5所述的识别方法,其特征在于,所述物体在图像中的高度通过所述物体在图像中的高度与图像高度的比值表示,所述物体在图像中的宽度通过所述物体在图像中的宽度与图像宽度的比值表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110506312.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种膝部约束带
- 下一篇:一种单投影仪3D成像的AR眼镜





