[发明专利]一种实时场景文本检测方法有效
| 申请号: | 202110612702.5 | 申请日: | 2021-06-02 |
| 公开(公告)号: | CN113255646B | 公开(公告)日: | 2022-10-18 |
| 发明(设计)人: | 李建武;任建国;周天飞 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19;G06V10/80;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 王松 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实时 场景 文本 检测 方法 | ||
本发明涉及一种实时场景文本检测方法,属于计算机视觉处理技术领域。首先提取当前自然场景图像的特征。然后采用交叉池化注意力方式,对深层特征的权重进行重新分配。之后对不同尺度的特征自下而上进行融合,将不同尺度特征进行合并。使用特征分块Transformer编码器处理文本多样性。分割出文本实例的“核”,从文本“核”中构建文本实例。本方法,仅需要少量的计算量即可增强骨架网络的特征表示能力。首次提出引用Transformer编码器结构并对其进行修改,得到特征分块Transformer编码器以处理文本多样性问题,对模型性能有较大的提升。本方法在满足实时性的前提下,性能领先于现有的实时场景文本检测方法,在实时性与精度之间实现了更好的平衡。
技术领域
本发明涉及一种实时场景文本检测方法,属于计算机视觉处理技术领域。
技术背景
图像文本检测,旨在对图像中的文本区域进行定位,通常使用矩形框或多边形框标示出图像中文本所在区域。图像文本识别,旨在将图像中的文本内容翻译成计算机中对应的文本表示。通常,文本检测与文本识别技术结合在一起,作为文本识别系统进行应用。
按照应用方向的不同,文本检测与文本识别可以分为两类。
一类用于扫描文件、个人证件、票据表单等固定场景下的图像处理,在该类领域中,通过文本检测与文本识别技术,对信息进行结构化的抽取并返回,以满足各行各业对数据录入、修改、储存与传输的需求,从而减小大量繁琐的工作量,降低企业用人成本,提高办公效率。
另一类是用于对商场、公路等自然场景图像的处理,文本检测与本文识别在该类任务中,通常用于对其他的任务进行辅助而非直接进行应用。例如,在自动驾驶任务中,对交通标志牌内容的检测与识别可以辅助自动驾驶系统对路况进行感知;在图像视频内容审核中,通过该技术实现对图像、视频帧中文字内容的抽取从而判断其中是否包含敏感信息。在线教育行业中,通过对图像中的文字内容进行定位与识别实现拍照翻译与拍照搜题的功能。由此可见,文本检测的精度直接影响着整个文本识别系统的性能。
对于固定场景的文本检测与文本识别技术已经十分成熟。但是,对自然场景图像的文本检测技术仍有很大的提升空间,其困难主要体现在成像的质量、复杂的背景、文本的多样性与可变性三个方面。
目前,基于深度学习的场景文本检测方法包括三种:基于边框回归的方法、基于图像分割的方法,以及二者混合的方法。
(1)基于边框回归的方法。在目标检测系统的模型框架上进行修改,以处理文本实例多样性等问题。但是,该类方法的主要问题在于:其很难对任意形状的文本实例进行检测,且检测速度较慢。
(2)基于分割的文本检测方法。通常是将图像中的文本作为前景统一分割,然后使用连通区域划分的方法区分不同的文本实例。但是,该类方法的主要问题在于:空间上相邻的文本实例在前景概率图中属于同一个连通区域,难以进行区分,因此在预测时需要对文本实例的表达方式进行修改。
(3)基于混合的方法。通常使用分割的方法先获取完整的文本实例前景概率图,然后使用检测的方法将不同的文本进行区分。该类方法虽然解决了基于边框回归方法存在的较难对任意形状文本实例进行检测的问题,但检测速度依然很慢,很难拓展到实时的场景任务中。
发明内容
本发明的目的是为了克服现有技术无法在检测速度与实时性之间进行有效平衡等缺陷,为有效解决高实时性模型无法获取高精度的技术问题,提出一种实时场景文本检测方法,能够高效、实时地提取自然场景图像中的文本位置。
一种实时场景文本检测方法,包括以下步骤:
步骤1:提取当前自然场景图像的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110612702.5/2.html,转载请声明来源钻瓜专利网。





