[发明专利]一种文字识别方法、装置、机器可读介质及设备在审

申请号：	202111488435.1	申请日：	2021-12-07
公开（公告）号：	CN114155536A	公开（公告）日：	2022-03-08
发明（设计）人：	肖遥;陈静;许梅芳	申请（专利权）人：	重庆中科云从科技有限公司
主分类号：	G06V30/148	分类号：	G06V30/148;G06V30/19;G06V10/74
代理公司：	上海光华专利事务所(普通合伙) 31219	代理人：	李铁
地址：	401120 重庆市渝***	国省代码：	重庆;50
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文字识别方法装置机器可读介质设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种文字识别方法，包括：获取待识别图像上记载的文本信息以及文本信息对应的位置信息；根据预设匹配规则，并基于待匹配的标题字段和内容字段从文本信息中匹配出与待匹配的标题字段和内容字段对应的候选标题字段以及候选内容字段；基于待识别对象中各标题字段之间的位置关系，对从文本信息中匹配出的候选标题字段进行组合，得到候选标题字段组合；从候选标题字段组合中确定出目标标题字段组合；根据目标标题段组合中的目标标题段以及目标标题字段与目标内容字段的位置关系确定目标内容字段。本发明可以实现多标题字段以及多匹配规则处理等功能，解决了开放版式票据模型定位精度低、开发周期长、泛化能力差等问题，具有很好的鲁棒性，在真实场景中具有高准确率。

技术领域

本发明涉及人工智能领域，具体涉及一种文字识别方法、装置、机器可读介质及设备。

背景技术

在OCR领域，对于识别固定版式的文本(例如身份证、驾驶证、增值税发票等)，我们通常采用深度学习的方法过拟合检测直接定位到需要识别的文本。这种方法具有精度高、抗干扰、速度快等优点。

而对于开放版式的文本(例如各省市的定额发票、出租车票等)，其内容和格式没有严格的规定，导致文本信息的分布存在一定随机性，单一的深度网络模型无法准确地定位需要识别的票面信息。如果针对每种格式的票面专门训练分类和字段检测模型，时间和人力成本又会大大增加，需要的机器资源也会成倍增加。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种文字识别方法、装置、机器可读介质及设备，用于解决现有技术存在的问题。

为实现上述目的及其他相关目的，本发明提供一种文字识别方法，包括：

获取待识别图像上记载的文本信息以及文本信息对应的位置信息；所述文本信息包括标题字段和内容字段；

根据预设匹配规则，并基于待匹配的标题字段和内容字段从所述文本信息中匹配出一个或多个与待匹配的标题字段和内容字段对应的候选标题字段以及候选内容字段；

基于待识别对象中各标题字段之间的位置关系，对从文本信息中匹配出的一个或多个候选标题字段进行组合，得到一个或多个候选标题字段组合；

从一个或多个候选标题字段组合中确定出目标标题字段组合；