[发明专利]一种文字识别方法、装置及电子设备在审
| 申请号: | 202010003178.7 | 申请日: | 2020-01-02 |
| 公开(公告)号: | CN113065544A | 公开(公告)日: | 2021-07-02 |
| 发明(设计)人: | 王晓振 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34 |
| 代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 郭少晶 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文字 识别 方法 装置 电子设备 | ||
1.一种文字识别方法,包括:
对待识别图像进行分块处理,得到多个图像块;
按照预设方法确定出所述多个图像块的文字区域;
对所述文字区域中的文字进行翻译后显示给用户。
2.根据权利要求1所述的方法,其中,所述按照预设方法确定出所述多个图像块的文字区域,包括:
按照顺序在第一方向上查找到第一个有文字的第一图像块时,识别出所述第一图像块中文字的第一坐标;
按照顺序在第二方向上查找到第一个有文字的第二图像块时,识别出所述第二图像块中文字的第二坐标;
根据所述第一坐标和所述第二坐标确定所述文字区域;
其中,在所述第二方向上查找的是除了已在所述第一方向上查找过的图像块之外的其他图像块。
3.根据权利要求2所述的方法,其中,所述按照预设方法确定出所述多个图像块的文字区域的步骤之后,所述方法还包括:
根据所述文字区域,在用户界面绘制交互框;
根据用户对所述交互框的调整操作,确定所述待识别图像中的识别区域;
对所述识别区域中的文字进行翻译后显示给用户。
4.根据权利要求3所述的方法,其中,所述根据用户对所述交互框的调整操作,确定所述待识别图像中的识别区域,包括:
根据用户对所述交互框的位置调整操作,确定所述待识别图像中的识别区域。
5.根据权利要求3所述的方法,其中,所述根据用户对所述交互框的调整操作,确定所述待识别图像中的识别区域,包括:
根据用户对所述交互框的大小调整操作,确定所述待识别图像中的识别区域。
6.根据权利要求3所述的方法,其中,所述在用户界面绘制交互框的步骤之后,所述方法还包括:
在所述用户界面显示操作提示信息,以提示用户通过调整所述交互框的大小和位置选择所述识别区域。
7.根据权利要求1所述的方法,其中,所述对所述待识别图像进行分块处理,包括:
通过图像识别算法对所述待识别图像进行分块处理。
8.一种用于文字识别的装置,包括:
分块模块,用于对待识别图像进行分块处理,得到多个图像块;
确定模块,用于按照预设方法确定出所述多个图像块的文字区域;
显示模块,用于对所述文字区域中的文字进行翻译后显示给用户。
9.一种电子设备,包括如权利要求8所述的用于文字识别的装置,或者,所述电子设备包括:
存储器,用于存储可执行命令;
处理器,用于在所述可执行命令的控制下,执行如权利要求1-7中任一项所述的文字识别方法。
10.一种计算机可读存储介质,存储有可执行指令,所述可执行指令被处理器执行时,执行如权利要求1-7中任一项所述的文字识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010003178.7/1.html,转载请声明来源钻瓜专利网。





