[发明专利]一种笔记透印去除方法及装置在审
申请号: | 201911065009.X | 申请日: | 2019-11-04 |
公开(公告)号: | CN112784850A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 陈晓念 | 申请(专利权)人: | 珠海金山办公软件有限公司;北京金山办公软件股份有限公司 |
主分类号: | G06K9/40 | 分类号: | G06K9/40;G06K9/46;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;马敬 |
地址: | 519015 广东省珠海市高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 笔记 去除 方法 装置 | ||
本发明实施例提供了一种笔记透印去除方法及装置,获取文本图像,对文本图像中的各像素点进行聚类,确定文本图像中各像素点所属色彩类别,提取背景色彩类别的聚类中心点的像素值,并利用背景色彩类别的聚类中心点的像素值替换属于背景色彩类别的所有像素点的像素值,得到更新的文本图像。本发明实施例能够实现自动化地、高效地去除文本图像中的笔记透印。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种笔记透印去除方法及装置。
背景技术
纸质文档的电子化是保存文档的一种重要手段,通过扫描的方式将纸质文档扫描为更易在电子设备上存储和拷贝的文本图像。纸质文档包括打印的纸质文档和手写的纸质文档,手写的纸质文档可能会出现笔记透印的现象,纸质文档背面的笔记透印会造成文档模糊,对有笔记透印的纸质文档进行扫描,扫描得到的文本图像也会因为有笔记透印而显得杂乱。
目前,去除文本图像中的笔记透印主要是通过人工的方式,利用图像处理软件对文本图像中的笔记透印进行擦除操作。图像处理软件的专业性较强,必须是专业的技术人员才可以对去除笔记透印,并且,如果文本图像中笔记透印的部分较多,则需要经过复杂的操作才可以去除笔记透印,去除笔记透印的效率较低。因此,如何自动化地、高效地去除文本图像中的笔记透印成为亟待解决的技术问题。
发明内容
本发明实施例的目的在于提供一种笔记透印去除方法及装置,以实现自动化地、高效地去除文本图像中的笔记透印。具体技术方案如下:
为达到上述目的,本发明公开了一种笔记透印去除方法,该方法包括:
获取文本图像;
对文本图像中的各像素点进行聚类,确定文本图像中各像素点所属色彩类别;
提取背景色彩类别的聚类中心点的像素值,并利用像素值替换属于背景色彩类别的所有像素点的像素值,得到更新的文本图像。
在本发明的一种实施方式中,在对文本图像中的各像素点进行聚类,确定文本图像中各像素点所属色彩类别之前,该方法还包括:
对文本图像中的像素点进行采样,获得预设数目个像素点;
对文本图像中的各像素点进行聚类,确定文本图像中各像素点所属色彩类别,包括:
对采样获得的预设数目个像素点进行聚类,确定预设数目个像素点分别所属的色彩类别。
在本发明的一种实施方式中,在对文本图像中的各像素点进行聚类,确定文本图像中各像素点所属色彩类别之前,该方法还包括:
减少文本图像中各像素点的存储位深,得到第一文本图像;
对文本图像中的各像素点进行聚类,确定文本图像中各像素点所属色彩类别,包括:
对第一文本图像中的各像素点进行聚类,确定第一文本图像中各像素点所属色彩类别。
在本发明的一种实施方式中,对文本图像中的各像素点进行聚类,确定文本图像中各像素点所属色彩类别的步骤,包括:
确定文本图像中各色彩类别的聚类中心点;
针对文本图像中的任一像素点,分别计算该像素点与各聚类中心点的距离,并确定该像素点所属色彩类别为该像素点与各聚类中心点的距离中的最小距离对应的聚类中心点的色彩类别。
在本发明的一种实施方式中,该方法还包括:
针对背景色彩类别以外的其他各色彩类别,提取并利用该色彩类别的聚类中心点的像素值替换属于该色彩类别的所有像素点的像素值,得到更新的文本图像。
为达到上述目的,本发明还公开了一种笔记透印去除装置,该装置包括:
获取模块,用于获取文本图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海金山办公软件有限公司;北京金山办公软件股份有限公司,未经珠海金山办公软件有限公司;北京金山办公软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911065009.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种二酸的制备方法
- 下一篇:一种用于丁烯芳构化的催化剂及其制备方法