[发明专利]文字识别方法和终端设备在审
申请号: | 201910863520.8 | 申请日: | 2019-09-12 |
公开(公告)号: | CN112487848A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 李月;赵骥伯;黄光伟;薛瑞彬;石炳川 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 武娜 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 识别 方法 终端设备 | ||
本发明涉及一种文字识别方法和终端设备。所述文字识别方法,包括:对待识别图像进行特征提取获取第一特征图;对第一特征图进行处理获得N个第一候选载体检测框;对N个第一候选载体检测框进行筛选获得K个第一目标载体检测框;对第一特征图进行特征提取获得第二特征图;对第二特征图进行处理获得L个第一候选文字检测框;对L个第一候选文字检测框进行筛选获得J个第一目标文字检测框;对J个第一目标文字检测框中的文字进行识别获得J个目标文字信息;根据J个目标文字信息输出K个识别结果;同一识别结果包括同一第一目标载体检测框对应的目标文字信息。根据本发明的实施例,可以对多个文字载体上的文字同时进行识别。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字识别方法和终端设备。
背景技术
相关技术中,识别名片上的文字大多数是基于以下流程:先通过直线检测提取名片边缘以减少背景的干扰,然后裁剪出名片部分,对名片上的文字进行检测和识别。然而,这种文字识别方法,存在如下问题:一次仅能识别一张名片或票据等文字载体上的文字信息,无法完成多个文字载体上的文字识别。因此,如何实现多个文字载体上的文字识别是需要解决的一个问题。
发明内容
本发明提供一种文字识别方法和终端设备,以解决相关技术中的不足。
根据本发明实施例的第一方面,提供一种文字识别方法,包括:
对待识别图像进行特征提取,获取第一特征图;所述待识别图像中包括文字以及至少一个文字载体;所述第一特征图携带文字载体的特征与文字的特征;
对所述第一特征图进行处理获得N个第一候选载体检测框;所述第一候选载体检测框用于框出文字载体;N为自然数;
对N个所述第一候选载体检测框进行筛选,获得K个第一目标载体检测框;K为自然数,K小于或者等于N;
对所述第一特征图进行特征提取,获得第二特征图;所述第二特征图携带文字的特征;
对所述第二特征图进行处理获得L个第一候选文字检测框;所述第一候选文字检测框用于框出文字;L为自然数;
对L个所述第一候选文字检测框进行筛选,获得J个第一目标文字检测框;J为自然数,J小于或者等于L;
对所述J个所述第一目标文字检测框中的文字进行识别,获得J个目标文字信息;
根据J个所述第一目标文字检测框各自的位置以及K个所述第一目标载体检测框各自的位置,对J个目标文字信息进行处理,并输出K个识别结果;其中,同一个识别结果包括位于同一个所述第一目标载体检测框中的所有第一目标文字检测框对应的目标文字信息。
在一个实施例中,所述方法还包括:
对所述第一特征图进行处理获得M个第一文字检测框;所述第一文字检测框用于框出文字;M为自然数;
所述对N个所述第一候选载体检测框进行筛选,获得K个第一目标载体检测框,可包括:
针对每个所述第一候选载体检测框,获取所述第一候选载体检测框分别与M个第一文字检测框的第一重叠面积,得到M个第一重叠面积;
当M个第一重叠面积中存在至少一个第一重叠面积大于或等于所选的第一重叠面积阈值时,确定所述第一候选载体为所述第一目标载体检测框。
在一个实施例中,所述对L个所述第一候选文字检测框进行筛选,获得J个第一目标文字检测框,可包括:
针对每个所述第一候选文字检测框,获取所述第一候选文字检测框分别与K个所述第一目标载体检测框的第二重叠面积,获得K个第二重叠面积;
当K个第二重叠面积中存在至少一个第二重叠面积大于或等于所选的第二重叠面积阈值时,确定所述第一候选文字检测框为所述第一目标文字检测框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910863520.8/2.html,转载请声明来源钻瓜专利网。