[发明专利]基于文字结构部件检测神经网络的文字检测方法及系统有效
| 申请号: | 201510968301.8 | 申请日: | 2015-12-21 |
| 公开(公告)号: | CN105608454B | 公开(公告)日: | 2019-08-09 |
| 发明(设计)人: | 周异;吴敏辰;陈凯;苗丽;奚国坚;周曲;任逍航 | 申请(专利权)人: | 上海交通大学;中国太平洋保险(集团)股份有限公司 |
| 主分类号: | G06K9/32 | 分类号: | G06K9/32;G06N3/02 |
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 徐红银;郭国中 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 文字 结构 部件 检测 神经网络 方法 系统 | ||
1.一种基于文字结构部件检测神经网络的文字检测方法,其特征在于:所述方法在深度卷积神经网络中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割;
所述方法包括以下步骤:
S1,在深度卷积神经网络构建文字结构部件检测层,所述文字结构部件检测层由多个文字结构部件检测器组成,针对中文字包含的文字结构部件的种类,对每一种文字结构部件构建相应的文字结构部件检测器;
S2,建立中文字数据集,包括从文字检测数据集中选出大量文字区域和非文字区域,用于训练深度学习网络;
所述S1、S2没有先后顺序要求,S1、S2完成后进行训练得到训练后的深度卷积神经网络;
S3,使用多尺度滑动窗算法提取自然图像中的候选文字区域,并由训练得到的深度卷积神经网络分类,得到文字区域;
S4,分析文字区域之间的相关性,将相关文字区域聚合成文本行,并用矩形框对文本行加以标定。
2.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于:所述构建文字结构部件检测层,具体如下:
S11,根据文字结构的长宽比,提取中文字中的文字结构种类;
S12,对于每一种文字结构,构建与其长宽比相同的卷积窗大小的卷积网络,网络大小由该种文字结构占所有文字结构的比例确定,作为一个文字结构检测器;
S13,将输入图像输入所有文字结构检测器,对所有种类的文字结构进行检测;
S14,合并所有文字结构检测器的输出进行合并,即为文字结构检测层的输出。
3.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于:所述S2中,建立的中文字数据集特征如下:
非文字区域图像中不包含任何文字;
文字区域图像有两种类型:全文字图像和半文字图像;
全文字图像中大部分区域为文字图像;
半文字图像中小部分区域为文字图像
数据集图像大小为32×32。
4.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于,所述S3中,使用多尺度滑动窗算法提取自然图像中的候选文字区域,其中提取参数如下:
最大尺度为1/4图像大小,最小尺度为20像素;
重叠系数为0.5滑动提取;
提取出的图像块长宽比为1:1,并统一缩放为32×32的图像块。
5.根据权利要求1所述的基于文字结构部件检测神经网络的文字检测方法,其特征在于,所述S4中,利用S3得到的文字区域,执行基于区域相关性的文本行聚合算法,具体相关性和聚合规则如下:
两个文字区域的高度比值该在0.5和2之间;
两个文字区域外接矩形的中心点y坐标差值不大于两个文字区域之间最高的高度值的1/2;
两个文字区域的外接矩形的中心点x坐标差值不大于两个文字区域之间最宽的宽度值的2倍;
单个文本行至少有三个以上的文字区域;
相关性为:两个文字区域的高度、两个文字区域外接矩形的中心点y坐标差、两个文字区域的外接矩形的中心点x坐标差;
聚合规则为:高度比值该在0.5和2之间、中心点y坐标差值不大于两个文字区域之间最高的高度值的1/2、中心点x坐标差值不大于两个文字区域之间最宽的宽度值的2倍。
6.一种用于实现权利要求1-5任一项所述方法的基于文字结构部件检测神经网络的文字检测系统,其特征在于包括:深度卷积神经网络模块,所述深度卷积神经网络模块中构建文字结构部件检测层,所述文字结构部件检测层对文字结构部件进行检测,从而实现文字区域定位和分割。
7.根据权利要求6所述的基于文字结构部件检测神经网络的文字检测系统,其特征在于,所述文字结构部件检测层,由多个文字结构部件检测器组成,针对中文字包含的文字结构部件的种类,对每一种文字结构部件构建相应的文字结构部件检测器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;中国太平洋保险(集团)股份有限公司,未经上海交通大学;中国太平洋保险(集团)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510968301.8/1.html,转载请声明来源钻瓜专利网。





