[发明专利]文字检测方法、系统、设备及存储介质有效

申请号：	202010846565.7	申请日：	2020-08-20
公开（公告）号：	CN111914843B	公开（公告）日：	2021-04-16
发明（设计）人：	张勇东;行梦婷;谢洪涛	申请（专利权）人：	合肥综合性国家科学中心人工智能研究院（安徽省人工智能实验室）
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/62;G06N3/04;G06T7/11;G06T7/12
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	薛福玲
地址：	230000 安徽省合肥市望江西路5089号***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文字检测方法系统设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了文字检测方法、系统、设备及存储介质，该方法包括采用残差网络进行特征提取得到特征图像；对特征图像进行上下文注意力处理，生成语义增强特征图；对语义增强特征图采用金字塔网络进行处理，生成共享特征图；对共享特征图采用区域提案网络进行处理，获得预测建议框；基于预测建议框，采用边界分割分支获得候选边界点；采用与边界分割分支并行的像素级嵌入分支对候选边界点进行过滤，得到最终边界点，以定位文本区域。解决了现有技术中文本检测方法仅在二维空间对于文本区域的特征进行表达，无法很好地消除文本区域背景噪声的问题，不仅能够对任意形状文本进行检测，还可以抑制背景似文本纹理噪声以实现更精确的任意形状场景文本定位。

技术领域

本发明涉及文本检测技术领域，尤其涉及一种文字检测方法、系统、设备及存储介质。

背景技术

场景文本检测技术旨在定位场景图像中的文本区域，其在自动驾驶，商标识别，盲人导向等计算机视觉任务中发挥着重要的作用。

近年来，基于边界点的文本表示方式较为流行，主要因为边界点可以更灵活地贴合曲形文本的形状，曲形文本的检测任务十分受用。然而，背景中与文本纹理相似的区域很容易被模型误判为文本区域，所以直接将边界点的分割或回归结果用于后续文本定位是不准确的。目前的文本检测方法仅在二维空间对于文本区域的特征表达，由于二维空间的限制，一些背景噪声无法很好地消除，使得于文本区域表达不准确。

发明内容

本申请实施例通过提供一种文字检测方法、系统、设备及存储介质，旨在解决现有技术中文本检测方法仅在二维空间对于文本区域的特征进行表达，无法很好地消除文本区域背景噪声的问题。

本申请实施例提供了一种文字检测方法，该方法包括：

采用残差网络进行特征提取得到特征图像；

对所述特征图像进行上下文注意力处理，生成语义增强特征图；

对所述语义增强特征图采用金字塔网络进行处理，生成共享特征图；

对所述共享特征图采用区域提案网络进行处理，获得预测建议框；

基于所述预测建议框，采用边界分割分支获得候选边界点；

采用与所述边界分割分支并行的像素级嵌入分支对所述候选边界点进行过滤，得到最终边界点，以定位文本区域。

优选的，所述采用残差网络进行特征提取得到特征图像的步骤，包括：

获取文本图像；

对所述文本图像进行卷积运算，生成所述特征图像。