[发明专利]文档图像底纹去除方法及系统有效
申请号: | 202010403455.3 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111583156B | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 王春恒;杜臣;肖柏华;贾馥溪;王燕娜 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/13;G06T7/136 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 底纹 去除 方法 系统 | ||
本发明涉及一种文档图像底纹去除方法及系统,所述去除方法包括:对原始文档图像进行二值化处理,得到二值化图像;提取二值化图像的边缘,得到边缘图像;融合边缘图像的设定距离的边缘,得到融合图像;根据融合图像及边缘图像,得到底纹纹理图;将原始文档图像等分成多个图像块;从图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;计算各第一像素点的像素值的均值,得到图像块的纹理均值;计算像素点的像素值与纹理均值之间的距离值;当距离值小于或等于颜色距离阈值,则将像素点对应的二值化图像中的像素点置零,得到二值化结果图像,在去除底纹的同时能有效的保留文档中被底纹干扰的文本信息。
技术领域
本发明涉及图像处理和文字识别技术领域,具体地是一种基于纹理提取与颜色分离的文档图像底纹去除方法及系统。
背景技术
随着互联网行业与人工智能研究的飞速发展,相关的技术如图像处理、模式识别、计算机视觉等也得到了迅速的发展。图像中的文字能表达高层语义信息,如果计算机可以自动理解图像中的文字,将会给人们的生活带来新的便利和体验。
而近年来,财务部门、金融机构、邮政电信等许多行业与单位对图像中的文字进行自动检测和识别的需求越来越大,实现文字信息的高速、自动地输入,将会节约了大量的人力资源,OCR(Optical Character Recognition,光学字符识别)技术由此产生。但OCR技术的成功依赖于对文本图像的预处理工作,而复杂的纹理广泛存在于交通、金融、税务等行业采用的文档中,尤其在税务票据中,为了防止票据的伪造,票据纸张多预先印刷上防伪纹理结构,然后在使用时再打印文本内容。
文档图像中的底纹种类繁多,不同图像中的底纹一般不同,且底纹多与图像中的待识别字符重合,严重影响后期图像版面分析与字符识别,因此对底纹的去除对后期票据图像的快速识别有着重要的意义。
发明内容
为了解决现有技术中的上述问题,即能够准确地去除图像中的底纹干扰,并保留待识别的文本信息,本发明的目的在于提供一种文档图像底纹去除方法及系统。
为解决上述技术问题,本发明提供了如下方案:
一种文档图像底纹去除方法,所述去除方法包括:
对原始文档图像进行二值化处理,得到二值化图像,其中,所述原始文档图像为彩色图像;
提取所述二值化图像的边缘,得到边缘图像;
融合所述边缘图像的设定距离的边缘,得到融合图像;
根据所述融合图像及边缘图像,得到底纹纹理图;
将所述原始文档图像等分成多个图像块;
针对每一图像块,
从所述图像块的各像素点中提取对应在所述底纹纹理图中被标记为底纹像素点的第一像素点;
计算各第一像素点的像素值的均值,得到所述图像块的纹理均值;
针对每一图像块及所述图像块的纹理均值,遍历所述图像块的全部像素点;
计算所述像素点的像素值与所述纹理均值之间的距离值;
比较所述距离值与预先设定的颜色距离阈值的大小:
当所述距离值小于或等于颜色距离阈值,则将所述像素点对应的二值化图像中的像素点置零,得到去除底纹后的二值化结果图像。
可选地,所述对原始文档图像进行二值化处理,得到二值化图像,具体包括:
对所述原始文档图像灰度化处理,得到灰度图;
比较所述灰度图中各中心像素的灰度值与预先设定的局部阈值的大小:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010403455.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序