[发明专利]一种图像识别方法、装置、电子设备及存储介质在审
申请号: | 202110359351.1 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113011409A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 单海蛟;何小坤;熊泽法 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 张子青 |
地址: | 100089 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 方法 装置 电子设备 存储 介质 | ||
本公开涉及一种图像识别方法、装置、电子设备及存储介质,通过获取目标图像,利用预先训练完成的图像分割模型得到目标检测框以及与目标检测框对应的图像分割结果图,根据目标检测框和图像分割结果图,对目标图像进行裁剪,得到与目标对象对应的目标区域,利用光学字符识别算法确定目标区域中目标对象的内容,得到识别结果,将目标检测算法和图像分割算法相结合,能够准确的对目标图像进行裁剪,得到单个目标区域,有效的减少其他文本信息的干扰,从而对目标区域进行精准的识别,提高图像识别的准确率。
技术领域
本公开涉及人工智能技术领域,尤其涉及一种图像识别方法、装置、电子设备及存储介质。
背景技术
现如今,随着人工智能的快速发展,通过对包含题目信息的图像进行题目搜索,从而得到专业的解答,已成为一种流行的学习方式。
目前基于图像进行题目的搜索的方法,主要为基于目标检测的方法,利用矩形框将图像中包含的每道题目进行框选,根据框选结果对图像中包含的多道题目进行裁剪,得到包含单个题目信息的题目区域,根据裁剪出的题目区域进行字符识别,根据识别内容进行搜索,获得精准的搜索结果。
但是,获取的图像包含的题目内容往往存在着倾斜和扭曲的现象,通过现有技术得到的题目区域难以将每道题目的边界准确的区分开,尤其在图像中包含多个题目区域时,题目框选的区域容易出现交叠的现象,根据框选结果对图像进行裁剪就会包含其他题目信息,从而导致单个题目识别结果的前、后或者中间出现干扰文本,无法得到准确的识别结果,搜索的准确率比较低。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种图像识别方法、装置、电子设备及存储介质。
第一方面,本公开实施例提供了一种图像识别方法,包括:
获取目标图像,所述目标图像中包含一个或多个目标对象;
根据所述目标图像,利用预先训练完成的图像分割模型得到目标检测框以及与所述目标检测框对应的图像分割结果图;
根据所述目标检测框和所述图像分割结果图,对所述目标图像进行裁剪,得到与所述目标对象对应的目标区域;
利用光学字符识别算法确定所述目标区域中所述目标对象的内容,得到识别结果。
可选地,所述根据所述目标检测框和所述图像分割结果图,对所述目标图像进行裁剪,得到与所述目标对象对应的目标区域,包括:
根据所述目标检测框对所述目标图像进行裁剪,得到第一目标图像;
根据所述图像分割结果图,确定所述图像分割结果图中分割出来的所述目标对象的最大连通区域;
根据所述最大连通区域的轮廓的像素点,得到所述轮廓的最小倾斜矩阵;
根据所述最小倾斜矩阵的倾斜角度将所述第一目标图像转正;
根据所述最小倾斜矩阵的宽和高对所述转正后的第一目标图像进行裁剪,得到与所述目标对象对应的目标区域。
可选地,在所述根据所述目标图像,利用预先训练完成的图像分割模型得到与所述目标对象对应的目标检测框以及与所述目标检测框对应的图像分割结果图之前,还包括:
将所述目标图像输入到预先训练完成的角度分类模型中,得到所述目标图像的角度分类结果,根据所述角度分类结果将所述目标图像进行旋转;
根据所述旋转后的目标图像,利用预先训练完成的图像分割模型得到目标检测框以及与所述目标检测框对应的图像分割结果图。
可选地,所述图像分割模型包括目标检测层和图像分割层,所述目标检测层用于对所述目标图像进行特征提取和目标检测,得到目标特征信息和目标检测框,所述图像分割层用于根据所述目标特征信息以及所述目标检测框,得到所述图像分割结果图。
可选地,所述图像分割层用于根据所述目标特征信息以及所述目标检测框,得到所述图像分割结果图,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110359351.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序