[发明专利]一种边框页码扫描系统有效
| 申请号: | 201810623834.6 | 申请日: | 2018-06-15 |
| 公开(公告)号: | CN108810307B | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 周康;李灏为 | 申请(专利权)人: | 深圳市成者云科技有限公司 |
| 主分类号: | H04N1/00 | 分类号: | H04N1/00;H04L29/08 |
| 代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李馨 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 边框 页码 扫描 系统 | ||
1.一种边框页码扫描系统,包括页面中设置边框限定有效区域的纸质笔记本、内置图像扫描装置的智能移动设备以及对提取内容进行数字化存储的云端服务器;其特征在于,所述边框为黑色直线条构成的矩形边框;
所述智能移动设备包括:
获取扫描图像内主体内容信息的第一提取单元;
获取所述扫描图像内页码信息的第二提取单元;
与所述第一提取单元、第二提取单元通信的融合单元,所述第一提取单元具体包括:
边框直线提取模块,提取扫描图像中所有边框直线,并根据直线相对于所述扫描图像中心点的位置进行分组,进而对所述边框直线提取两条pair直线,根据所述两条pair直线的夹角及距离对所述边框直线进行筛选,得到上、下、左、右四组边框直线集合;
置信度计算模块,在所述上、下、左、右四组边框直线集合中各任取一条直线组成一个四边形区域,并计算该四边形即为所述边框的置信度,遍历所有可能组合并分别计算相应的置信度;
主体内容信息裁剪模块,选取置信度最大的一组直线的交点作为边框的四个角点,根据角点做仿射变换裁剪出主体内容信息;
以及与所述云端服务器进行数据交互的通信单元;
开始时,使用智能移动设备扫描笔记本内需要保存的页面提取扫描图像;此时第一提取单元提取图像中的边框,并进一步提取所述边框内部的主体内容信息;然后,所述第二提取单元锁定页码在所述扫描图像中的位置并提取页码字符;最后融合单元将所述主体内容信息与所述页码信息融合生成带页码的分割主体文件,由智能移动设备展现并通过所述通信单元发送至云端服务器保存。
2.根据权利要求1所述的一种边框页码扫描系统,其特征在于,所述智能移动设备还包括存储单元,存储所述的主体内容信息、页码信息及带页码的分割主体文件;
当所述融合单元判断所述第一提取单元、第二提取单元对同一扫描对象提取成功时,则将对应的主体内容信息、页码信息及带页码的分割主体文件保存在存储单元中;
当所述融合单元判断所述第一提取单元或第二提取单元对同一扫描对象提取不成功时,智能移动设备提示重新扫描。
3.根据权利要求1所述的一种边框页码扫描系统,其特征在于,所述边框直线提取模块提取扫描图像中所有边框直线的具体步骤包括:
采用hough直线提取方法获取扫描图像中的所有局部直线,对各局部直线分组并利用最小二乘法根本将各组局部直线分别拟合成连接直线;
根据连接直线特征滤除多余的干扰直线,所述连接直线特征包括连接直线数量及连接直线见的欧氏距离。
4.根据权利要求1所述的一种边框页码扫描系统,其特征在于,所述置信度根据以下公式计算:
C=0.0001×S0-10×S1-10×(abs(S2-0.75))
其中S0为四边形区域的面积,S1为该四边形区域的封闭性参数,S2为该四边形区域的高宽比。
5.根据权利要求4所述的一种边框页码扫描系统,其特征在于,所述四边形区域的高宽比为3:4。
6.根据权利要求1所述的一种边框页码扫描系统,其特征在于,所述第二提取单元具体包括:
页码信息粗略估计模块,根据边框的四个角点位置锁定页码所在的大区域;
页码信息精细提取模块,对页码所在大区域进行OTSU二值化处理,提取候选字符区域。
7.根据权利要求6所述的一种边框页码扫描系统,其特征在于,所述第二提取单元还包括:
页码识别模块,采用autoencoder方法训练得到中间特征向量Z,其中训练集为实际场景中裁剪出的页面图像块;将Z送入SVM分类器中进行分类,最终得到页码识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市成者云科技有限公司,未经深圳市成者云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810623834.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扫描仪
- 下一篇:一种3D扫描仪支撑设备





