[发明专利]一种边框页码扫描系统有效
| 申请号: | 201810623834.6 | 申请日: | 2018-06-15 |
| 公开(公告)号: | CN108810307B | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 周康;李灏为 | 申请(专利权)人: | 深圳市成者云科技有限公司 |
| 主分类号: | H04N1/00 | 分类号: | H04N1/00;H04L29/08 |
| 代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李馨 |
| 地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 边框 页码 扫描 系统 | ||
本发明公开的一种边框页码扫描系统,通过第一提取单元与扫描图像中的黑色线条边框共同作用,实现了扫描图像主体内容的准确定位和提取,抗干扰性强;同时通过第二提取单元对扫描图像中的页码进行识别和提取;通过融合单元将扫描图像主体内容信息与页码信息进行数字化存储,方便后续文件排序和内容检索。
技术领域
本发明涉及智能图像提取技术领域,具体说涉及一种边框页码扫描系统。
背景技术
多数人在工作或者学习中,都会养成选取重要内容并进行随时记录的习惯,传统的纸、笔记录模式虽然有效,但是无法保证资料能够妥善保存。即便保存方式得当,但想要在日积月累的大量笔记文件中找到特定内容,效率较低。随着电子技术的发展以及智能存储设备的普及,出现了通用的手机扫描应用,其从技术角度上说均采取提取边缘,并根据主体页面的内容进行分析提取,方便保存。但是这种通用扫描系统普遍存在页面主体捕捉准确度不高,同时针对存储的大量电子文件依旧存在查找效率低下的问题。
发明内容
鉴于现有技术的不足,本发明的目的是要提供一种以边框和页码为对象,并且能够快速提取纸质页面主体内容并进行有序数字化保存的扫描系统,进一步提高主体捕捉的准确度以及后期使用过程中的检索效率。
一种边框页码扫描系统,包括页面中设置边框限定有效区域的纸质笔记本、内置图像扫描装置的智能移动设备以及对提取内容进行数字化存储的云端服务器;其特征在于,所述智能移动设备包括:
获取扫描图像内主体内容信息的第一提取单元;
获取所述扫描图像内页码信息的第二提取单元;
与所述第一提取单元、第二提取单元通信的融合单元;
以及与所述云端服务器进行数据交互的通信单元;
开始时,使用智能移动设备扫描笔记本内需要保存的页面提取扫描图像;此时第一提取单元提取图像中的边框,并进一步提取所述边框内部的主体内容信息;然后,所述第二提取单元锁定页码在所述扫描图像中的位置并提取页码字符;最后融合单元将所述主体内容信息与所述页码信息融合生成带页码的分割主体文件,由智能移动设备展现并通过所述通信单元发送至云端服务器保存。
基于上述方案,进一步优选的,
所述智能移动设备还包括存储单元,存储所述的主体内容信息、页码信息及带页码的分割主体文件;
当所述融合单元判断所述第一提取单元、第二提取单元对同一扫描对象提取成功时,则将对应的主体内容信息、页码信息及带页码的分割主体文件保存在存储单元中;
当所述融合单元判断所述第一提取单元或第二提取单元对同一扫描对象提取不成功时,智能移动设备提示重新扫描。
基于上述方案,进一步优选的,
所述第一提取单元具体包括:
边框直线提取模块,提取扫描图像中所有边框直线,并根据直线相对于所述扫描图像中心点的位置进行分组,得到上、下、左、右四组边框直线集合;
置信度计算模块,在所述上、下、左、右四组边框直线集合中各任取一条直线组成一个四边形区域,并计算该四边形即为所述边框的置信度,遍历所有可能组合并分别计算相应的置信度;
主体内容信息裁剪模块,选取置信度最大的一组直线的交点作为边框的四个角点,根据角点做仿射变换裁剪出主体内容信息。
基于上述方案,进一步优选的,
所述边框直线提取模块提取扫描图像中所有边框直线的具体步骤包括:
采用hough直线提取方法获取扫描图像中的所有局部直线,对各局部直线分组并利用最小二乘法根本将各组局部直线分别拟合成连接直线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市成者云科技有限公司,未经深圳市成者云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810623834.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:扫描仪
- 下一篇:一种3D扫描仪支撑设备





