[发明专利]一种基于渐进矫正机制的场景文本识别方法在审
申请号: | 202111039925.3 | 申请日: | 2021-09-06 |
公开(公告)号: | CN113723423A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 廖倩颖;梁凌宇;金连文;林庆祥;罗灿杰;张家鑫;彭德智;王天玮 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06K9/36 | 分类号: | G06K9/36;G06K9/34;G06K9/32 |
代理公司: | 北京东方盛凡知识产权代理事务所(普通合伙) 11562 | 代理人: | 李娜 |
地址: | 510641 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 渐进 矫正 机制 场景 文本 识别 方法 | ||
本发明公开了一种基于渐进矫正机制的场景文本识别方法,包括:采集场景文本图像,将所述场景文本图像进行渐进式矫正,获得目标文本图像,基于所述目标文本图像进行文本识别,获得识别结果。本发明通过采用一种渐进的矫正机制将不规则文本矫正为规则文本,并将其准确识别,能够消除拍摄角度带来的透视变形和字符的不规则排列带来的弯曲性等形变,同时剔除或抑制复杂背景带来的干扰,解决了包含不规则文本的场景识别问题,大大提高了识别系统对场景文本的鲁棒性,从而进一步提升了识别效果。
技术领域
本发明属于文本图像识别领域,特别是涉及一种基于渐进矫正机制的场景文本识别方法。
背景技术
文本是用来记录、交流或继承文化的符号系统。作为人类最具影响力的发明之一,文本在人类生活中发挥着重要作用。具体而言,文本承载了丰富而精确的语义信息,所以在基于视觉的应用场景中非常重要,如图像搜索、智能检测、工业自动化、机器人导航和实时翻译。由于其重要性,近年来自然场景中的文本识别引起了学术界和工业界的极大兴趣。
对于文本识别任务,传统的方法通常是先对文本图像进行单字分割,然后使用人工设计的特征来进行单字识别,最后再利用语言模型把单字组合成句子。这种方法高度依赖分割的准确性,且对人工设计特征的要求很高,很难达到很好的识别效果。
近年来,深度学习的方法在图像分类、语音识别、人脸识别等领域都取得了优异的效果,因此,利用深度学习的方法来进行场景文本识别已经成为主流的方法。虽然得益于深度学习方法,场景文本识别已经获得了长足的发展,但场景文本识别仍然具有很大的挑战性。其主要的技术难点在于场景文本具有模糊、弯曲、倾斜、透视变换以及字体风格多样等问题。这给本身就复杂的场景文本识别增加了很大的难度。对包含不规则文本的场景图像进行矫正是解决这一问题的有效方案之一,它可以将文本转换为更规则的形状,并提高识别性能。
发明内容
本发明的目的是提供一种基于渐进矫正机制的场景文本识别方法,以解决上述现有的技术难点,使场景文本图像的识别能够更加准确。
为实现上述目的,本发明提供了如下方案:本发明提供一种基于渐进矫正机制的场景文本识别方法,包括如下内容:
采集场景文本图像,将所述场景文本图像进行渐进式矫正,获得目标文本图像,基于所述目标文本图像进行文本识别,获得识别结果。
优选地,将所述场景文本图像进行渐进式矫正的过程包括,第一次矫正、第二次矫正;
所述第一次矫正通过全局矫正器对所述场景文本图像进行整体形变矫正,获得第一文本图像;
所述第二次矫正通过局部矫正器对所述第一文本图像进行局部形变矫正,获得目标文本图像。
优选地,基于所述目标文本图像进行文本识别包括,采用特征矫正器和文本识别器对所述目标文本图像进行文本识别,获得所述识别结果。
优选地,所述全局矫正器包括定位网络、网格生成器和采样器;
所述局部矫正器包括偏移预测网络、网格生成器和采样器;
所述定位网络包括卷积层、全连接层。
优选地,通过所述全局矫正器对所述场景文本图像进行整体形变矫正包括,通过卷积网络结构搭建所述全局矫正器,基于所述全局矫正器,获得所述场景文本图像的整体形变,基于所述整体形变进行空间变换,完成整体形变矫正。
优选地,基于所述全局矫正器,获得所述场景文本图像的整体形变包括,将所述场景文本图像输入所述全局矫正器,获得空间变换矩阵,基于所述空间变换矩阵和所述网格生成器对所述场景文本图像进行空间变换,获得第一采样网格;基于所述第一采样网格,通过采样器对所述场景文本图像进行采样,获得第一文本图像。
优选地,所述空间变换矩阵用于通过对所述场景文本图像进行旋转、放缩和平移,消除文本图像的透视形变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111039925.3/2.html,转载请声明来源钻瓜专利网。