[发明专利]基于文字结构部件检测神经网络的文字检测方法及系统有效

专利信息
申请号: 201510968301.8 申请日: 2015-12-21
公开(公告)号: CN105608454B 公开(公告)日: 2019-08-09
发明(设计)人: 周异;吴敏辰;陈凯;苗丽;奚国坚;周曲;任逍航 申请(专利权)人: 上海交通大学;中国太平洋保险(集团)股份有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06N3/02
代理公司: 上海汉声知识产权代理有限公司 31236 代理人: 徐红银;郭国中
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 文字 结构 部件 检测 神经网络 方法 系统
【权利要求书】:

1.一种基于文字结构部件检测神经网络的文字检测方法,其特征在于:所述方法在深度卷积神经网络中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割;

所述方法包括以下步骤:

S1,在深度卷积神经网络构建文字结构部件检测层,所述文字结构部件检测层由多个文字结构部件检测器组成,针对中文字包含的文字结构部件的种类,对每一种文字结构部件构建相应的文字结构部件检测器;

S2,建立中文字数据集,包括从文字检测数据集中选出大量文字区域和非文字区域,用于训练深度学习网络;

所述S1、S2没有先后顺序要求,S1、S2完成后进行训练得到训练后的深度卷积神经网络;

S3,使用多尺度滑动窗算法提取自然图像中的候选文字区域,并由训练得到的深度卷积神经网络分类,得到文字区域;

S4,分析文字区域之间的相关性,将相关文字区域聚合成文本行,并用矩形框对文本行加以标定。

2.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于:所述构建文字结构部件检测层,具体如下:

S11,根据文字结构的长宽比,提取中文字中的文字结构种类;

S12,对于每一种文字结构,构建与其长宽比相同的卷积窗大小的卷积网络,网络大小由该种文字结构占所有文字结构的比例确定,作为一个文字结构检测器;

S13,将输入图像输入所有文字结构检测器,对所有种类的文字结构进行检测;

S14,合并所有文字结构检测器的输出进行合并,即为文字结构检测层的输出。

3.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于:所述S2中,建立的中文字数据集特征如下:

非文字区域图像中不包含任何文字;

文字区域图像有两种类型:全文字图像和半文字图像;

全文字图像中大部分区域为文字图像;

半文字图像中小部分区域为文字图像

数据集图像大小为32×32。

4.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于,所述S3中,使用多尺度滑动窗算法提取自然图像中的候选文字区域,其中提取参数如下:

最大尺度为1/4图像大小,最小尺度为20像素;

重叠系数为0.5滑动提取;

提取出的图像块长宽比为1:1,并统一缩放为32×32的图像块。

5.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于,所述S4中,利用S3得到的文字区域,执行基于区域相关性的文本行聚合算法,具体相关性和聚合规则如下:

两个文字区域的高度比值该在0.5和2之间;

两个文字区域外接矩形的中心点y坐标差值不大于两个文字区域之间最高的高度值的1/2;

两个文字区域的外接矩形的中心点x坐标差值不大于两个文字区域之间最宽的宽度值的2倍;

单个文本行至少有三个以上的文字区域;

相关性为:两个文字区域的高度、两个文字区域外接矩形的中心点y坐标差、两个文字区域的外接矩形的中心点x坐标差;

聚合规则为:高度比值该在0.5和2之间、中心点y坐标差值不大于两个文字区域之间最高的高度值的1/2、中心点x坐标差值不大于两个文字区域之间最宽的宽度值的2倍。

6.一种用于实现权利要求1-5任一项所述方法的基于文字结构部件检测神经网络的文字检测系统,其特征在于包括:深度卷积神经网络模块,所述深度卷积神经网络模块中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割。

7.根据权利要求6所述的基于文字结构部件检测神经网络的文字检测系统,其特征在于,所述文字结构部件检测层,由多个文字结构部件检测器组成,针对中文字包含的文字结构部件的种类,对每一种文字结构部件构建相应的文字结构部件检测器。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;中国太平洋保险(集团)股份有限公司,未经上海交通大学;中国太平洋保险(集团)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510968301.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top