[发明专利]文本识别方法、装置及设备有效

申请号：	201910197234.2	申请日：	2019-03-15
公开（公告）号：	CN111695385B	公开（公告）日：	2023-09-26
发明（设计）人：	程战战	申请（专利权）人：	杭州海康威视数字技术股份有限公司
主分类号：	G06V30/414	分类号：	G06V30/414;G06V30/148;G06V30/19;G06V10/82;G06N3/0442;G06N3/045;G06N3/0895;G06N3/092
代理公司：	北京博思佳知识产权代理有限公司 11415	代理人：	林祥
地址：	310051 浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本识别方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本说明书提供一种文本识别方法、装置及设备，该方案预先训练有切割模型，由切割模型获得待识别文本图像的切割位置，从而可以将待识别文本图像切割出大小合适的子图像，防止图像中的文本被不完整切割；由于将图像切割了多个子图像，为了防止上下文信息丢失，已训练的文本识别模型可以识别输入的子图像的语义特征信息，并结合语义特征信息上下文识别出各子图像对应的文本信息，进而可识别所述待识别文本图像。

技术领域

本说明书涉及文本识别技术领域，尤其涉及文本识别方法、装置及设备。

背景技术

现有的文本识别方案大多数是单字符识别方案或短文本识别方案。其中，单字符识别方案通常是先获取单个字符，然后对单个字符进行分类，进而得到识别结果，该类方案具有成本高昂等缺陷。短文本识别方案对于较短文本的识别具有优势，但如果面临几十个字符以上的长度的长文本识别，则准确率大幅下降。

发明内容

为克服相关技术中存在的问题，本说明书提供了文本识别方法、装置及设备。

根据本说明书实施例的第一方面，提供一种文本识别方法，所述方法包括：

利用已训练的切割模型确定待识别文本图像的一个或多个切割位置；

根据所述一个或多个切割位置，将所述待识别文本图像切割为至少两个子图像；

将各个子图像输入至已训练的文本识别模型，由所述文本识别模型识别输入的子图像的语义特征信息，并结合语义特征信息上下文识别出子图像对应的文本信息；

根据识别出的各子图像对应的文本信息，识别所述待识别文本图像。

可选的，所述文本识别模型中包括：双向长短时记忆网络BLSTM；