[发明专利]图片文字识别方法及系统在审
申请号: | 201911116166.9 | 申请日: | 2019-11-14 |
公开(公告)号: | CN110909737A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 严雄伟 | 申请(专利权)人: | 武汉虹旭信息技术有限责任公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 张睿 |
地址: | 443000 湖北省武汉市江*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 文字 识别 方法 系统 | ||
本发明实施例提供一种图片文字识别方法及系统。其中,方法包括:获取待处理的每一原始图片的特征码,根据各原始图片的特征码,确定各原始图片中的各待识别图片;将每一待识别图片分别输入至文字识别模型,输出待识别图片中文字的识别结果;其中,文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。本发明实施例提供的图片文字识别方法及系统,根据各原始图片的特征码进行去重,确定各待识别图片,基于通过深度学习获得的文字识别模型,获得每一待识别图片中文字的识别结果,能提高进行海量图片文字识别的准确率和效率。
技术领域
本发明涉及计算机技术领域,更具体地,涉及一种图片文字识别方法及系统。
背景技术
随着4G网络的全面普及以及5G网络投入商用,移动数据网络已成为天然的大数据存储和流动的载体。移动互联网指互联网的技术、平台、商业模式和应用与移动通信技术结合并实践的活动的总称。移动互联网拥有的数据源丰富多样,其中图片的数据量级越来越大,图片中附带的信息量也越来越大。为了能从这些海量图片中提取有用的信息,需要对图片中的文字进行识别,然后转换为半结构化数据存入数据中心,用于提供更全面的数据存储和检索服务。
现有图片文字识别系统都是对单张图片构建的。进行图片文字识别时,主要采用开源的计算机视觉库OpenCV对图片进行预处理,然后进行字符识别。上述方法对数字以及英文的识别效果不错,但是中文的识别效果很差。并且,上述方法对图片的质量要求较高,移动互联网中图片质量参差不齐。因此,现有方法难以适应对移动互联网中的海量图片进行文字识别,如何准确、高效地对移动互联网中的海量图片进行文字识别成为本领域亟待解决的问题。
发明内容
本发明实施例提供一种图片文字识别方法及系统,用以解决或者至少部分地解决现有技术存在的难以准确、高效地进行海量图片文字识别的缺陷。
第一方面,本发明实施例提供一种图片文字识别方法,包括:
获取待处理的每一原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片;
将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果;
其中,所述文字识别模型是基于样本图片和预先获知的样本图片中的文字进行训练后得到的。
优选地,所述确定各所述原始图片中的各待识别图片之后,还包括:
将所述各待识别图片的特征码批量写入特征码存储集群进行存储。
优选地,所述获取待处理的每一原始图片的特征码,根据各所述原始图片的特征码,确定各所述原始图片中的各待识别图片的具体步骤包括:
获取每一所述原始图片的特征码;
若判断获知所述特征码存储集群已存储的每一特征码,与所述原始图片的特征码不同,则将所述原始图片作为待识别图片。
优选地,将每一所述待识别图片分别输入至文字识别模型,输出所述待识别图片中文字的识别结果的具体步骤包括:
将所述待识别图片输入至所述文字识别模型中的图片特征提取子模型,输出所述待识别图片的特征向量;
将所述特征向量输入至所述文字识别模型中的文本序列提取子模型,输出所述特征向量对应的文本序列;
将所述待识别图片与所述特征向量对应的文本序列进行对齐,获取所述待识别图片中文字的识别结果。
优选地,所述输出所述待识别图片中文字的识别结果之后,还包括:
将所述各待识别图片中文字的识别结果批量写入文本存储集群进行存储。
第二方面,本发明实施例提供一种图片文字识别系统,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉虹旭信息技术有限责任公司,未经武汉虹旭信息技术有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911116166.9/2.html,转载请声明来源钻瓜专利网。