[发明专利]图像识别方法、设备及存储介质有效
申请号: | 202010299804.1 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111507250B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 侯琦;王子豪;刘霄 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/148 |
代理公司: | 北京合智同创知识产权代理有限公司 11545 | 代理人: | 李杰 |
地址: | 100086 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 方法 设备 存储 介质 | ||
本申请实施例提供一种图像识别方法、设备及存储介质,图像识别方法包括:对目标图像进行文本行检测确定至少一个文本行;利用分割模型在每一个文本行中确定至少一个分割线,并根据至少一个分割线将文本行分割为至少一个公式片段和至少一个文字片段,分割线用于分割公式片段和/或文字片段;对至少一个公式片段和至少一个文字片段进行识别得到目标图像的识别结果。提高了图像识别过程中的准确率。
技术领域
本申请实施例涉及图像识别技术领域,尤其涉及图像识别方法、设备及存储介质。
背景技术
光学字符识别(Optical Character Recognition,OCR)算法可以对图像中的内容进行识别,并转化为可编辑的文本类的格式。
OCR算法应用于生活的各个方面。例如,在一种应用场景中,学生在线上向老师提交试卷或者作业,老师可以接收到试卷或者作业的图像,该图像包含文字和公式等,利用OCR算法对图像内容进行识别,可以帮助老师进行智能批阅,但是OCR算法对于包含了文字和公式的图像,识别准确率较差。
发明内容
有鉴于此,本发明实施例所解决的技术问题之一在于提供一种图像识别方法、设备及存储介质,用以克服上述缺陷。
本申请实施例提供一种图像识别方法,包括:
对目标图像进行文本行检测确定至少一个文本行;
利用分割模型在每一个文本行中确定至少一个分割线,并根据至少一个分割线将文本行分割为至少一个公式片段和至少一个文字片段,分割线用于分割公式片段和/或文字片段;
对至少一个公式片段和至少一个文字片段进行识别得到目标图像的识别结果。
可选地,在本申请的一种实施例中,利用分割模型在每一个文本行中确定至少一个分割线,并根据至少一个分割线将文本行分割为至少一个公式片段和至少一个文字片段,包括:
将至少一个文本行的图像输入分割模型得到至少一个文本行的热力图和类别图;
根据热力图中的高斯峰值确定至少一个分割线;
根据至少一个分割线将至少一个文本行的图像和类别图进行分割得到至少一个文字片段和至少一个公式片段。
可选地,在本申请的一种实施例中,该方法还包括:
根据至少一个分割线将文本行分割为至少一个片段;
根据至少一个片段中每个类别的像素占比确定每一个片段属于文字片段或公式片段。
可选地,在本申请的一种实施例中,根据至少一个片段中每个类别的像素占比确定每一个片段属于文字片段或公式片段,包括:
对于目标片段,确定目标片段中每个像素的类别;
如果目标片段中文字类别的像素占比大于公式类别的像素占比,确定目标片段属于文字片段;
如果目标片段中公式类别的像素占比大于文字类别的像素占比,确定目标片段属于公式片段。
可选地,在本申请的一种实施例中,对于目标片段,确定目标片段中每个像素的类别,包括:
确定目标片段中每一个像素的文字概率值和公式概率值;
将每一个像素的概率值中较大的概率值对应的类别确定为像素的类别。
可选地,在本申请的一种实施例中,对至少一个公式片段和至少一个文字片段进行识别得到目标图像的识别结果,包括:
利用公式识别模型对至少一个公式片段进行识别得到公式识别的结果;
利用文字识别模型对至少一个文字片段进行识别得到文字识别的结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010299804.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种圆形玻璃裁剪装置
- 下一篇:图像处理方法及装置、电子设备和计算机存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序