[发明专利]文字识别方法、装置、电子设备及存储介质有效

专利信息
申请号: 202110068580.8 申请日: 2021-01-19
公开(公告)号: CN112861648B 公开(公告)日: 2023-09-26
发明(设计)人: 刘翔;刘莹 申请(专利权)人: 平安科技(深圳)有限公司
主分类号: G06V30/40 分类号: G06V30/40;G06V30/14;G06V30/19;G06V10/82;G06N3/044;G06N3/049;G06T5/50;G06T7/11
代理公司: 深圳市沃德知识产权代理事务所(普通合伙) 44347 代理人: 高杰;于志光
地址: 518000 广东省深圳市福田区福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字 识别 方法 装置 电子设备 存储 介质
【权利要求书】:

1.一种文字识别方法,其特征在于,所述方法包括:

获取文本图像,对所述文本图像进行文字检测,得到文字检测框;

对所述文字检测框进行筛选及合并,得到目标文字框;

对所述目标文字框进行无文字区域裁剪,得到裁剪文字框;

对所述裁剪文字框进行文字提取,得到初始文字集;

提取所述初始文字集中的关键文字,并利用正则校验技术对所述关键文字进行校验,将检验成功的所述关键文字作为所述文本图像的文字识别结果;

其中,所述对所述文本图像进行文字检测,得到文字检测框,包括:利用文字目标框检测模型中的卷积层对所述文本图像进行图像特征提取,得到特征图像,所述文字目标框检测模型是预先训练完成的;利用所述文字目标框检测模型中批标准化层对所述特征图像进行标准化操作,得到标准特征图像;利用所述文字目标框检测模型中融合层将所述文本图像的底层特征与所述标准特征图像进行融合,得到目标特征图像;利用所述文字目标框检测模型中激活函数输出所述目标特征图像的检测结果,根据所述检测结果,生成文字检测框;

所述对所述目标文字框进行无文字区域裁剪,得到裁剪文字框,包括:对所述目标文字框进行二值化处理,得到二值化文字框;查询所述二值化文字框中纵轴方向的文字起始位置和文字终止位置以及所述二值化文字框的纵轴方向长度,根据所述纵轴方向的文字起始位置、文字终止位置以及纵轴方向长度,对所述二值化文字框进行纵向裁剪,得到纵向裁剪文字框;查询所述纵向裁剪文字框中横轴方向的文字起始位置和文字终止位置以及所述纵向裁剪文字框的横轴方向长度,根据所述横轴方向的文字起始位置和文字终止位置以及横轴方向长度,对所述纵向裁剪文字框进行横向裁剪,得到裁剪文字框。

2.如权利要求1所述的文字识别方法,其特征在于,所述对所述裁剪文字框进行文字提取,得到初始文字集,包括:

利用文字提取模型中的卷积神经网络对所述裁剪文字框进行特征提取,得到特征文字框,所述文字提取模型是预先训练完成的;

利用所述文字提取模型中的长短期记忆网络对所述特征文字框进行文字位置序列识别,生成原始文字集;

利用所述文字提取模型中的时序分类网络对所述原始文字集进行字符对齐,生成初始文字集。

3.如权利要求2中所述的文字识别方法,其特征在于,所述利用文字提取模型中的卷积神经网络对所述裁剪文字框进行特征提取,得到特征文字框,包括:

利用所述卷积神经网络中的卷积层对所述裁剪文字框进行卷积特征提取,得到初始特征文字框;

利用所述卷积神经网络中的池化层对所述初始特征文字框进行降维,得到降维特征文字框;

利用所述卷积神经网络中的全连接层输出所述降维特征文字框,得到特征文字框。

4.如权利要求2中所述的文字识别方法,其特征在于,所述利用所述文字提取模型中的长短期记忆网络对所述特征文字框进行文字位置序列识别,生成原始文字集,包括:

利用所述长短期记忆网络的输入门计算所述特征文字框的状态值;

利用所述长短期记忆网络的遗忘门计算所述特征文字框的激活值;

根据所述状态值和激活值计算所述特征文字框的状态更新值;

利用所述长短期记忆网络的输出门计算所述状态更新值的文字位置序列,生成原始文字集。

5.如权利要求1至4中任意一项所述的文字识别方法,其特征在于,所述提取所述初始文字集中的关键文字,包括:

删除所述初始文字集中的停用词,得到标准文字集;

计算所述标准文字集中每个标准文字的权重,从所述标准文字集中筛选出所述权重大于预设权重的标准文字作为所述关键文字。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110068580.8/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top