[发明专利]一种文本检测方法、装置及电子设备在审
| 申请号: | 202010537495.7 | 申请日: | 2020-06-12 |
| 公开(公告)号: | CN111666941A | 公开(公告)日: | 2020-09-15 |
| 发明(设计)人: | 张水发 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 孙翠贤;高莺然 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文本 检测 方法 装置 电子设备 | ||
本公开关于一种文本检测方法、装置及电子设备,该方法包括:获取待检测图像;从待检测图像中,确定关于文本行的备选区域;确定备选区域的锚点特征;其中,锚点特征包括备选区域的倾斜角度和尺寸特征两类特征信息;利用备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定备选区域是否为文本行;其中,文本行识别结果用于表征区域是否为文本行的结果;锚点数据为基于预设的多个样本锚点特征所确定出的数据;当备选区域为文本行时,将备选区域的内容确定为检测得到的文本。与现有技术相比,应用本公开提供的方案,可以提高在OCR检测过程中,所检测得到的文本区域的准确率,进而,提高所获取到的图像中的文字的准确性。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种文本检测方法、装置及电子设备。
背景技术
当前OCR(Optical Character Recognition,光学字符识别)检测在各个领域中的应用越来越广泛,所谓OCR是指:对文本资料进行扫描后,对扫描得到的图像进行分析处理,从而获取该图像中的文字及版面信息的过程。
其中,在进行OCR检测时,由于扫描时文本资料所摆放角度、扫描仪器的物理参数限制等原因,所得到的图像中,各文本行所在的文本区域可能是倾斜的。
基于此,在OCR检测过程中,当使用当前所存在的各种目标对象检测方法时,由于无法检测到倾斜的文本区域,因此,导致所检测得到的文本区域的准确率较低,从而大大降低了所获取到的图像中的文字的准确性。
发明内容
本公开提供一种文本检测方法、装置、电子设备及存储介质,以至少解决相关技术中在OCR检测过程中,由于无法检测到倾斜的文本区域所导致的所检测得到的文本区域的准确率较低,降低了所获取到的图像中的文字的准确性的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种文本检测方法,包括:
获取待检测图像;
从所述待检测图像中,确定关于文本行的备选区域;
确定所述备选区域的锚点特征;其中,所述锚点特征包括所述备选区域的倾斜角度和尺寸特征两类特征信息;
利用所述备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定所述备选区域是否为文本行;其中,所述文本行识别结果用于表征区域是否为文本行的结果;所述锚点数据为基于预设的多个样本锚点特征所确定出的数据;
当所述备选区域为文本行时,将所述备选区域的内容确定为所检测得到的目标文本。
可选的,一种具体实现方式中,所述锚点数据与文本行识别结果的对应关系包括:锚点类别与文本行识别结果的对应关系;
所述利用所述备选区域的锚点特征,以及预设的锚点数据与文本行识别结果的对应关系,确定所述备选区域是否为文本行的步骤,包括:
确定所述备选区域的锚点特征所属的目标锚点类别;
利用所述目标锚点类别,以及预设的锚点类别与文本行识别结果的对应关系,确定所述备选区域是否为文本行。
可选的,一种具体实现方式中,所述关于锚点类别与文本行识别结果的对应关系的确定方式,包括:
获取第一样本图像的特征图,以及基于第二样本图像中各个文本行的锚点特征得到的各个锚点类别;
基于所述特征图和所述各个锚点类别,进行关于文本区域的类别回归和检测框回归,得到多个初始文本区域;
在所述特征图中截取各个初始文本区域对应的待回归文本区域;
对所截取到的多个待回归文本区域进行类别回归、检测框回归和角度回归,得到关于锚点类别与文本行识别结果的对应关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010537495.7/2.html,转载请声明来源钻瓜专利网。





