[发明专利]一种文字识别方法、装置及电子设备在审
| 申请号: | 202010003178.7 | 申请日: | 2020-01-02 |
| 公开(公告)号: | CN113065544A | 公开(公告)日: | 2021-07-02 |
| 发明(设计)人: | 王晓振 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 郭少晶 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文字 识别 方法 装置 电子设备 | ||
本说明书实施例涉及一种文字识别方法、装置、电子设备及计算机可读存储介质。该方法包括:对待识别图像进行分块处理,得到多个图像块;按照预设方法确定出所述多个图像块的文字区域;对所述文字区域中的文字进行翻译后显示给用户。从而通过减少识别区域来优化识别速度,提升用户体验。
技术领域
本说明书实施例涉及AR文字识别技术领域,更具体地,涉及一种文字识别方法、一种用于文字识别的装置、一种电子设备以及一种计算机可读存储介质。
背景技术
AR文字识别是由摄像头获取真实世界的图像后,使用文字识别算法识别图像中的文字,对文字进行二次处理,如当识别到的文字为英文时,对英文进行翻译后,叠加在真实环境的图像上显示给用户。
目前,AR文字识别已被广泛应用。但现有的AR文字识别技术的识别时间较长、性能较差。因此,需要提供一种新的方法来缩短识别时间,并提升识别性能。
发明内容
本说明书实施例的一个目的是提供一种文字识别的新的技术方案。
根据本说明书实施例的第一方面,提供了一种文字识别方法,包括:
对待识别图像进行分块处理,得到多个图像块;
按照预设方法确定出所述多个图像块的文字区域;
对所述文字区域中的文字进行翻译后显示给用户。
可选地,其中,所述按照预设方法确定出所述多个图像块的文字区域,包括:
按照顺序在第一方向上查找到第一个有文字的第一图像块时,识别出所述第一图像块中文字的第一坐标;
按照顺序在第二方向上查找到第一个有文字的第二图像块时,识别出所述第二图像块中文字的第二坐标;
根据所述第一坐标和所述第二坐标确定所述文字区域;
其中,在所述第二方向上查找的是除了已在所述第一方向上查找过的图像块之外的其他图像块。
可选地,其中,所述按照预设方法确定出所述多个图像块的文字区域的步骤之后,所述方法还包括:
根据所述文字区域,在用户界面绘制交互框;
根据用户对所述交互框的调整操作,确定所述待识别图像中的识别区域;
对所述识别区域中的文字进行翻译后显示给用户。
可选地,其中,所述根据用户对所述交互框的调整操作,确定所述待识别图像中的识别区域,包括:
根据用户对所述交互框的位置调整操作,确定所述待识别图像中的识别区域。
可选地,其中,所述根据用户对所述交互框的调整操作,确定所述待识别图像中的识别区域,包括:
根据用户对所述交互框的大小调整操作,确定所述待识别图像中的识别区域。
可选地,其中,所述在用户界面绘制交互框的步骤之后,所述方法还包括:
在所述用户界面显示操作提示信息,以提示用户通过调整所述交互框的大小和位置选择所述识别区域。
根据本说明书实施例的第二方面,提供了一种用于文字识别的装置,包括:
分块模块,用于对待识别图像进行分块处理,得到多个图像块;
确定模块,用于按照预设方法确定出所述多个图像块的文字区域;
显示模块,用于对所述文字区域中的文字进行翻译后显示给用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010003178.7/2.html,转载请声明来源钻瓜专利网。





