[发明专利]图像的识别方法、装置、设备、存储介质及程序产品在审
申请号: | 202210107087.7 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114511741A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 杨红明;潘恒;张凯鹏;谷伟波;王红法;李志鋒;刘威 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/40;G06V10/26;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 彭奇;王黎延 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 装置 设备 存储 介质 程序 产品 | ||
1.一种图像的识别方法,其特征在于,所述方法包括:
基于待识别图像调用检测模型进行标识检测处理,得到所述待识别图像中的待识别标识图像;
基于所述待识别标识图像调用识别模型进行特征提取处理,得到所述待识别标识图像的图像特征;
获取标识图像库中每个样本标识图像对应的图像特征,确定所述待识别标识图像的图像特征与所述每个样本标识图像的图像特征之间的特征距离;
将最小的所述特征距离对应的所述样本标识图像所属的类别,作为所述待识别标识图像所属的类别。
2.如权利要求1所述的方法,其特征在于,所述基于待识别图像调用检测模型进行标识检测处理,得到所述待识别图像中的待识别标识图像,包括:
基于所述待识别图像调用所述检测模型对所述待识别图像进行多个层次的上采样处理,得到每个层次对应的上采样特征图,其中,除最后层次之外的每个层次的上采样特征图,用于作为下一层次的上采样处理的输入;
对每个所述上采样特征图进行特征融合处理,得到所述待识别图像的融合特征图;
基于所述融合特征图对所述待识别图像进行边界框预测处理,得到待识别标识的边界框;
基于所述边界框对所述待识别图像进行分割处理,得到所述待识别图像中的所述待识别标识图像。
3.如权利要求1所述的方法,其特征在于,
所述图像特征包括标识图像特征;
所述基于所述待识别标识图像调用识别模型进行特征提取处理,得到所述待识别标识图像的图像特征,包括:
基于所述待识别标识图像调用所述识别模型进行图像语义特征提取处理,得到所述待识别标识图像的对应的语义特征,将所述语义特征由离散变量形式转换为连续向量形式,得到所述待识别标识图像的标识图像特征。
4.如权利要求1所述的方法,其特征在于,
所述图像特征包括标识图像特征;
所述获取标识图像库中每个样本标识图像对应的图像特征,确定所述待识别标识图像的图像特征与所述每个样本标识图像的图像特征之间的特征距离,包括:
获取所述标识图像库中每个所述样本标识图像对应的标识图像特征,并对每个所述样本标识图像对应的标识图像特征进行以下处理:
对所述待识别标识图像的标识图像特征与所述样本标识图像的标识图像特征进行相减,得到标识图像特征之差;
基于所述标识图像特征之差确定特征距离。
5.如权利要求1所述的方法,其特征在于,
所述图像特征包括标识图像特征以及标识名称;
所述将最小的所述特征距离对应的所述样本标识图像所属的类别,作为所述待识别标识图像所属的类别,包括:
当最小的所述特征距离小于或等于特征距离阈值时,将最小的所述特征距离对应的所述样本标识图像所属的类别,作为所述待识别标识图像所属的类别;
当所述最小的所述特征距离大于特征距离阈值时,调用所述识别模型对所述待识别标识图像进行文本检测处理,得到所述待识别标识图像中的文本区域图像,对所述文本区域图像进行文本识别处理,得到所述待识别标识图像的标识名称;
基于所述待识别标识图像的标识名称对所述标识图像库中的每个所述样本标识图像的标识名称进行匹配处理,将与所述待识别标识图像的标识名称匹配的目标样本标识图像作为最小的所述特征距离对应的所述样本标识图像,将所述目标样本标识图像所属的类别作为所述待识别标识图像所属的类别。
6.如权利要求2所述的方法,其特征在于,
所述图像特征包括标识图像特征以及标识名称;
所述将最小的所述特征距离对应的所述样本标识图像所属的类别,作为所述待识别标识图像所属的类别之后,所述方法还包括:
将所述边界框的位置、所述待识别标识图像的标识名称以及所述待识别标识图像所属的类别,组合为识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210107087.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序