[发明专利]一种电子文档自动识别系统及方法在审
| 申请号: | 202110527087.8 | 申请日: | 2021-05-14 |
| 公开(公告)号: | CN113361330A | 公开(公告)日: | 2021-09-07 |
| 发明(设计)人: | 尹源 | 申请(专利权)人: | 南京诚勤教育科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06K9/34;G06K9/40;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京中建联合知识产权代理事务所(普通合伙) 11004 | 代理人: | 王晓艳 |
| 地址: | 210000 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 电子 文档 自动识别 系统 方法 | ||
1.一种电子文档自动识别方法,其特征在于,所述方法包括以下步骤:
S1获取待识别图片,对图片进行二值化处理,并利用Laplacian算子检测出已被二值化的图像边缘,然后去除噪声;
S2用笔画刷子将边缘信息连接成块,通过启发规则对图像中的文本进行定位;
S3对图像进行高斯模型拟合得到特征值波动范围,并采用最大最小值算法分割区域;
S4用高斯拟合每个分割区域并估计特征参数值,让重叠点加入到相邻区域内;
S5重新估计新区域参数并与旧区域参数作比较后做相应处理,得出图像中文本的分割区域;
S6使用深度学习算法经过文字信息采集、信息分析和处理、信息分类和判断后得到电子文本。
2.根据权利要求1所述的电子文档自动识别方法,其特征在于,所述方法中,利用基于窗口方法遍历整幅图像,同时提取窗口中LBP直方图的特征,最后利用多项式神经网络分类器对区域进行分类,实现图像中的文本定位。
3.根据权利要求1所述的电子文档自动识别方法,其特征在于,所述方法中,用高斯拟合每个分割区域并估计特征参数值,让重叠点加入到相邻区域内,然后重新估计新区域参数并与旧区域参数作比较,如果小于标准范围,则归并重叠点,否则归并到其它相邻区域,直到得出图像中文本的分割区域为止。
4.根据权利要求1所述的电子文档自动识别方法,其特征在于,所述S6中基于SWT文字检测进行文字识别,包括如下步骤:
T1用SWT为图像中每个像素分配它所属位置笔画宽度的像素值;
T2具有相似笔画宽度的连通区域合并在一起,并计算连通区域间的差异;
T3具有较小差异的连通区域被认为是字符候选区域,笔画宽度、大小和其他启发性属性相似的字符候选区域合并在一起组成文字候选区域。
5.根据权利要求4所述的电子文档自动识别方法,其特征在于,所述方法中,从图像中分离出含有文字的候选连通区域,首先,使用底层的图像处理方法分离出候选连通域,然后通过对这些区域分类,剔除不包含文字的连通域,识别返回较少数量的区域候选。
6.根据权利要求1所述的电子文档自动识别方法,其特征在于,所述方法的深度学习算法使用ACF和Edge Boxes以优势互补的方式产生文字候选,并提取这些文字候选的HOG特征;接着训练随机森林分类器过滤掉不包含文字的样本;然后调整单词候选的位置以使得候选位置更加接近文字的真实边界框;接着训练固定词典内的英文单词CNN分类器,识别单词候选;利用NMS合并相互重叠较大的单词候选区域;最后除去得分小于某一阈值的单词候选区域,保留得分大于某一阈值的单词候选区域。
7.根据权利要求6所述的电子文档自动识别方法,其特征在于,所述方法的深度学习算法使用时首先进行数据预处理,求取卷积神经网络前向过程中所有特征图上响应值的标准差和均值,然后用特征图上的每个响应值减去均值,并把得到的结果除以标准差,接着对特征图作线性变换,在反向传播过程中,利用随机梯度下降算法得到线性变换的参数,进而提高卷积神经网络的收敛速度。
8.一种电子文档自动识别系统,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如权利要求1至7中任一项所述的电子文档自动识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京诚勤教育科技有限公司,未经南京诚勤教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110527087.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑工程用的道路桥梁裂缝整平修复装置
- 下一篇:一种三段式隧道洗车机





