[发明专利]文本识别方法、装置及设备有效

专利信息
申请号: 201910197234.2 申请日: 2019-03-15
公开(公告)号: CN111695385B 公开(公告)日: 2023-09-26
发明(设计)人: 程战战 申请(专利权)人: 杭州海康威视数字技术股份有限公司
主分类号: G06V30/414 分类号: G06V30/414;G06V30/148;G06V30/19;G06V10/82;G06N3/0442;G06N3/045;G06N3/0895;G06N3/092
代理公司: 北京博思佳知识产权代理有限公司 11415 代理人: 林祥
地址: 310051 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文本 识别 方法 装置 设备
【权利要求书】:

1.一种文本识别方法,其特征在于,包括:

利用已训练的切割模型确定待识别文本图像的一个或多个切割位置;

根据所述一个或多个切割位置,将所述待识别文本图像切割为至少两个子图像;

将各个子图像输入至已训练的文本识别模型,由所述文本识别模型识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出子图像对应的文本信息;所述文本识别模型包括双向长短时记忆网络,所述网络:对首个输入的子图像,结合下一子图像的初始隐状态携带的语义特征信息进行识别;对最后一个输入的子图像,结合上一子图像的最终隐状态携带的语义特征信息进行识别;对于非首个且非最后一个的子图像,结合上一子图像的最终隐状态携带的语义特征信息和/或下一子图像的初始隐状态携带的语义特征信息进行识别;

根据识别出的各子图像对应的文本信息,识别所述待识别文本图像。

2.根据权利要求1所述的方法,其特征在于,所述根据所述文本识别模型识别出的各子图像对应的文本信息,识别所述待识别文本图像,包括:

按照所述各子图像在所述待识别文本图像中的排列顺序,将各子图像对应的文本信息进行拼接,根据拼接结果确定所述待识别文本图像对应的文本。

3.根据权利要求1所述的方法,其特征在于,所述切割模型通过如下方式训练得到:

配置增强学习算法的如下输入参数:环境、动作空间、状态空间和奖励,利用配置好参数的增强学习算法训练得到所述切割模型;其中,

所述环境包括:样本单行文本图像,所述样本单行文本图像标注有对应文本;

所述动作空间包括:对所述样本单行文本图像中设定大小窗口内的切割动作;

所述状态空间包括:所述样本单行文本图像被切割之后得到的两个样本子图像;

所述奖励基于拼接结果是否匹配所述样本单行文本图像的标注文本而确定;所述拼接结果利用文本识别模型分别对两个所述样本子图像的识别结果拼接得到。

4.根据权利要求3所述的方法,其特征在于,所述利用已训练的切割模型确定待识别文本图像的一个或多个切割位置,包括:

从所述待识别文本图像中获取待评估窗口图像,将所述待评估窗口图像输入至所述切割模型中,由所述切割模型在所述待评估窗口图像中获取切割位置;其中,所述待评估窗口图像的大小与所述设定大小窗口的大小相匹配。

5.根据权利要求1所述的方法,其特征在于,利用预先切割的多个样本切割图像训练文本识别模型,直至文本识别模型的识别能力满足设定要求后,切割模型的训练过程和文本识别模型的训练过程交替进行;

其中,文本识别模型在切割模型的训练过程中提供识别结果,切割模型在文本识别模型的训练过程中提供样本切割图像。

6.一种文本识别装置,其特征在于,包括:

位置确定模块,用于:利用已训练的切割模型确定待识别文本图像的一个或多个切割位置;

切割模块,用于:根据所述一个或多个切割位置,将所述待识别文本图像切割为至少两个子图像;

输入模块,用于:将各个子图像输入至已训练的文本识别模型,由所述文本识别模型识别输入的子图像的语义特征信息,并结合语义特征信息上下文识别出子图像对应的文本信息;所述文本识别模型包括双向长短时记忆网络,所述网络:对首个输入的子图像,结合下一子图像的初始隐状态携带的语义特征信息进行识别;对最后一个输入的子图像,结合上一子图像的最终隐状态携带的语义特征信息进行识别;对于非首个且非最后一个的子图像,结合上一子图像的最终隐状态携带的语义特征信息和/或下一子图像的初始隐状态携带的语义特征信息进行识别;

识别模块,用于:根据识别出的各子图像对应的文本信息,识别所述待识别文本图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910197234.2/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top