[发明专利]文本修正方法、装置、设备及介质有效
申请号: | 202110775077.6 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113255652B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 赵明;田科;阳锋;章宏武 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 范彦扬 |
地址: | 100089 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 修正 方法 装置 设备 介质 | ||
本公开提供一种文本修正方法、装置、设备及介质,其中该方法包括:获取待处理的文本图像;采用预先训练得到的检测模型对文本图像中所包含的文本字符以及修改符号进行检测,得到文本字符的第一位置和修改符号的第二位置;基于第一位置和第二位置,从文本图像中提取出待识别内容;利用预先训练得到的识别模型对待识别内容进行识别,得到文本字符识别结果以及修改符号识别结果;基于修改符号识别结果,对文本字符识别结果进行修正。上述方式较好地保障了文本识别的准确性和可靠性,可以有效提升用户体验。
技术领域
本公开涉及图像处理领域,尤其涉及文本修正方法、装置、设备及介质。
背景技术
图像识别技术是人工智能的一个重要应用分支,其中,可以自动检测并识别出图像中文字的文本检测/识别技术也逐渐兴起,并广泛应用于诸如拍照判题等在线教育领域、拍照识别地址等物流领域、拍照录入文字等编辑领域等多个领域。
然而,发明人研究发现,用户在书写过程中可能因出现笔误、顺序表达错误、缺字等情况需要使用诸如删除符、对调符、增添符等各种文稿修改符号来对已书写内容进行修改,但是相关的文本识别技术仅能识别出已书写内容,但识别出的内容实质上是错误的,并非用户修改后的表达义,也即,相关的文本识别技术难以针对带有文稿修改符号的文本图像进行正确识别,用户体验较差。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种文本修正方法、装置、设备及介质。
根据本公开的一方面,提供了一种文本修正方法,包括:获取待处理的文本图像;采用预先训练得到的检测模型对所述文本图像中所包含的文本字符以及修改符号进行检测,得到所述文本字符的第一位置和所述修改符号的第二位置;基于所述第一位置和所述第二位置,从所述文本图像中提取出待识别内容;利用预先训练得到的识别模型对所述待识别内容进行识别,得到文本字符识别结果以及修改符号识别结果;基于所述修改符号识别结果,对所述文本字符识别结果进行修正。
根据本公开的另一方面,提供了一种文本修正装置,包括:图像获取模块,用于获取待处理的文本图像;检测模块,用于采用预先训练得到的检测模型对所述文本图像中所包含的文本字符以及修改符号进行检测,得到所述文本字符的第一位置和所述修改符号的第二位置;内容提取模块,用于基于所述第一位置和所述第二位置,从所述文本图像中提取出待识别内容;识别模块,用于利用预先训练得到的识别模型对所述待识别内容进行识别,得到文本字符识别结果以及修改符号识别结果;修正模块,用于基于所述修改符号识别结果,对所述文本字符识别结果进行修正。
根据本公开的另一方面,提供了一种电子设备,包括:处理器;以及存储程序的存储器,其中,所述程序包括指令,所述指令在由所述处理器执行时使所述处理器执行上述的文本修正方法。
根据本公开的另一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述的文本修正方法。
本公开实施例中提供的上述技术方案,首先获取待处理的文本图像,然后采用预先训练得到的检测模型对文本图像中所包含的文本字符以及修改符号进行检测,得到文本字符的第一位置和修改符号的第二位置,并基于第一位置和第二位置从文本图像中提取出待识别内容,之后可进一步利用预先训练得到的识别模型对待识别内容进行识别,得到文本字符识别结果以及修改符号识别结果,最后能够基于修改符号识别结果对文本字符识别结果进行修正。通过上述方式,可以借助模型对文本图像中的文本字符以及修改符号进行检测及识别,还可以基于修改符号识别结果来修正文本字符识别结果,修正后的文本字符识别结果则为用户的真正表达义,较好地保障了文本识别的准确性和可靠性,可以有效提升用户体验。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110775077.6/2.html,转载请声明来源钻瓜专利网。