[发明专利]光学字符序列识别方法以及装置在审

专利信息
申请号: 202010247747.2 申请日: 2020-03-31
公开(公告)号: CN113469183A 公开(公告)日: 2021-10-01
发明(设计)人: 张丽;陈志强;李元景;邢宇翔;郑大川;刘永春;黄日辰;王午羲 申请(专利权)人: 同方威视技术股份有限公司;清华大学
主分类号: G06K9/34 分类号: G06K9/34;G06K9/20
代理公司: 中科专利商标代理有限责任公司 11021 代理人: 倪斌
地址: 100084 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 光学 字符 序列 识别 方法 以及 装置
【说明书】:

本申请提供了一种基于二叉树的字符排序方法、基于二叉树的字符排序装置、光学字符序列定位和识别方法、光学字符序列定位和识别装置、电子设备以及计算机可读存储介质。所述基于二叉树的字符排序方法包括:在包括目标字符序列的区域中进行图案采集,以获得图案集合;对图案集合中的每一个图案进行遍历,将处于相同行或列中的图案置于相同二叉树中;以及从二叉树中顺序识别各个节点处的图案,以获得目标字符序列。

技术领域

本公开涉及图像识别领域,并且更具体地涉及一种基于二叉树的字符排序方法、基于二叉树的字符排序装置、光学字符序列识别方法、光学字符序列识别装置、电子设备以及计算机可读存储介质。

背景技术

光学字符识别是对具有文本资料的图像文件进行分析,获取文字及版面信息的过程。在应用场景上,识别自然场景图片中的文字信息,难度远大于扫描文档图像中的文字识别。这是因为:字符有不同的大小、字体、颜色、亮度、对比度等;文本行可以有横向、竖向、弯曲、旋转、扭曲等;图像中的文字区域可能存在变形(透视、仿射变换)、残缺、模糊等;自然场景图像的背景极其多样,例如文字在平面、曲面或折皱面、文字区域附近有复杂的干扰纹理、或非文字区域有近似文字的纹理等。

目前图像文字检测和识别技术有着广泛的应用场景,例如,识别名片、识别菜单、识别快递单、识别身份证、识别营业证、识别银行卡、识别车牌、识别路牌、识别商品包装袋、识别会议白板、识别广告主干词、识别试卷、识别单据、识别车厢集装箱号等等。

但是,目前的文字检测和识别技术难以在大尺寸自然场景或复杂场景图像中识别小尺寸区域内字符序列。

因此,需要一种能够在大尺寸自然场景或复杂场景图像中识别小尺寸区域内字符序列的技术。

发明内容

【技术方案】

本申请提出多个方面以解决上述问题。

在本申请的第一方面中,一种基于二叉树的字符排序方法包括:在包括目标字符序列的区域中进行图案采集,以获得图案集合;对所述图案集合中的每一个图案进行遍历,将处于相同行或列中的图案置于相同二叉树中;以及从二叉树中顺序识别各个节点处的图案,以获得所述目标字符序列。

根据第一方面,其中,将处于相同行或列中的图案置于相同二叉树中可以包括:所述二叉树中的左子树中的每个节点处放置的图案为置于所述二叉树的根节点处的基准图案之前的图案,并且其中,所述左子树中的每个字符所处的节点远离所述根节点的程度与该节点处的图案在其所处的行或列中远离所述基准图案的程度相对应,并且其中,所述二叉树中的右子树中的每个节点处放置的图案为置于所述二叉树的根节点处的基准图案之后的图案,并且其中,所述右子树中的每个图案所处的节点远离所述根节点的程度与该节点处的图案在其所处的行或列中远离所述基准图案的程度相对应。

根据第一方面,对所述图案集合中的每一个图案进行遍历包括:确定所述图案集合中的每一个图案与数据库中预先存储的字符匹配的概率;将概率大于第一预定阈值的图案确定为字符;利用所确定的字符形成字符集合;以及以所述字符集合之中的具有最大概率的字符作为起始字符,按照概率从大到小的顺序对所述字符集合中的每一个字符进行遍历。

根据本申请的第一方面,其中,所述二叉树中的节点处放置的图案均为字符,并且其中所述二叉树中的根节点处放置的所述基准图案为所述起始字符。

根据本申请的第一方面,将处于相同行或列中的字符置于相同二叉树中包括:计算被遍历的字符与所述起始字符的质心连线与预定轴线之间的角度;响应于所计算的角度小于或等于预定角度阈值,确定被遍历的字符与所述起始字符处于相同的行或列中,并且将被遍历的字符置于以所述起始字符为根节点的二叉树中;以及响应于所计算的角度大于所述预定角度阈值,确定被遍历的字符与所述起始字符处于不同的行或列中,并且将被遍历的字符置于新的二叉树中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同方威视技术股份有限公司;清华大学,未经同方威视技术股份有限公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010247747.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top