[发明专利]一种文档快速扫描方法有效
申请号: | 201711339455.6 | 申请日: | 2017-12-14 |
公开(公告)号: | CN108024026B | 公开(公告)日: | 2019-06-28 |
发明(设计)人: | 袁常青;薛立徽;马炳佳;邓耀隆;徐清艳;罗家强 | 申请(专利权)人: | 广东金赋科技股份有限公司 |
主分类号: | H04N1/00 | 分类号: | H04N1/00;H04N1/04;G06T7/11;G06T7/136;G06T5/00 |
代理公司: | 北京易捷胜知识产权代理事务所(普通合伙) 11613 | 代理人: | 韩国胜 |
地址: | 528200 广东省佛山市南海区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 快速 扫描 方法 | ||
1.一种文档快速扫描方法,其特征在于,包括:
针对待处理的文档,采用图像采集装置拍摄所述文档的照片;
针对所述照片,选取最优分割效果的第一阈值;
根据选定的第一阈值,将所述照片的每一像素进行二值化处理;
对二值化处理后的图像进行毛刺去除处理;
将毛刺去除后的图像进行存储,获得扫描后的文档;
其中,对二值化处理后的图像进行毛刺去除处理,包括:
对二值化处理后的图像左上角为起点,以横向和纵向建立坐标,横向以2min个像素为间隔,纵向以q个像素为间隔取离散的点(x,y);
对于每一个离散的点,依据线段选取规则分别计算横向和纵向的线段长度;
从所有线段长度中选取的不在字体范围内的线段长度;
对选取的不在字体范围内的线段长度的所有像素全部采用白色像素替换;
其中,min为大于1的自然数,min的大小是根据字体设定的,q为自然数。
2.根据权利要求1所述的方法,其特征在于,选取最优分割效果的第一阈值,包括:
采用设定的第二阈值,将所述照片中像素的灰度分为两种,得到大于第二阈值的第一类灰度,和小于等于第二阈值的第二类灰度;
获取第一类灰度的第一均值,第二类灰度的第二均值;
获取第一均值与所述照片中所有像素的灰度均值的差值、第二均值与所述照片中所有像素的灰度均值的差值的平方和;
调整所述第二阈值,重复获取调整后第二阈值对应的平方和;
在平方和最大时,将对应的第二阈值作为选取的最优分割效果的第一阈值。
3.根据权利要求1所述的方法,其特征在于,选取最优分割效果的第一阈值的步骤之前,所述方法还包括:
获取所述照片中灰度的像素数量小于像素总数与第三阈值乘积的所有灰度,将获取的所有灰度作为待删除的灰度;其中,照片中待删除的灰度中每一灰度的像素数量小于照片中像素总数与第三阈值的乘积。
4.根据权利要求3所述的方法,其特征在于,选取最优分割效果的第一阈值,包括:
采用设定的第二阈值,将所述照片中像素的灰度分为两种,得到大于第二阈值的第一类灰度,和小于等于第二阈值的第二类灰度;
将所述第一类灰度和第二类灰度中属于待删除的灰度进行删除,得到处理后的第一类灰度和处理后的第二类灰度;
获取处理后的第一类灰度的第一均值,处理后的第二类灰度的第二均值;
获取第一均值与所述照片中所有像素的灰度均值的差值、第二均值与所述照片中所有像素的灰度均值的差值的平方和;
调整所述第二阈值,重复获取调整后第二阈值对应的平方和;
在平方和最大时,将对应的第二阈值作为选取的最优分割效果的第一阈值。
5.根据权利要求1至4任一所述的方法,其特征在于,所述根据选定的第一阈值,将所述照片的每一像素进行二值化处理,包括:
采用公式一对所述照片的每一个像素进行二值化处理;
公式一:
其中,i为所述照片中每一个像素的灰度,T为所述第一阈值,所述I(x,y)为二值化处理后的像素灰度。
6.根据权利要求1所述的方法,其特征在于,所述待处理的文档为文字类型的纸质版文件。
7.根据权利要求3所述的方法,其特征在于,所述将毛刺去除后的图像进行存储,获得扫描后的文档,包括:
将所述毛刺去除后的图像以jpg格式保存,获得扫描后的图像格式的文档;
和/或,
所述第三阈值为0.09-0.11;所述第一阈值为100-200。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东金赋科技股份有限公司,未经广东金赋科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711339455.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于水产品储存的存放箱
- 下一篇:一种旅游体验、社交和代购服务平台及方法