[发明专利]基于图半监督学习的文档二值化处理方法、系统、装置有效
申请号: | 201811334371.8 | 申请日: | 2018-11-09 |
公开(公告)号: | CN109460735B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 殷飞;吴金文;孙俊;刘成林 | 申请(专利权)人: | 中国科学院自动化研究所;富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 文档 二值化 处理 方法 系统 装置 | ||
本发明属于模式识别领域,具体涉及一种基于图半监督学习的文档二值化处理方法、系统、装置,旨在为了解决古籍文档文本识别准确度较低的问题。本发明方法包括:获取待处理的图像;降采样和k近邻法构图;基于分别从前景和背景中选取样本点作为标记的种子点;采用图半监督学习方法进行结点分类;基于前景结点进行图像恢复;对恢复后的图像进行二值化,得到二值化的图像。本发明可以较好地保留文字的纤细笔画,不仅提提高了文字识别的准确度、也提高了文字细节识别的准确度,对于光照不均和背景复杂的图像也有较好的鲁棒性,同时降采样提高了半监督学习算法求解过程的运行速度。
技术领域
本发明属于模式识别领域,具体涉及一种基于图半监督学习的文档二值化处理方法、系统、装置。
背景技术
一些古籍文档由于过度使用或者因保存环境恶劣而导致图像严重的退化(比如缺损、污渍、文字渗透及文字过淡等现象),对于这些古籍文档的文本识别目前常用的方法是通过二值化方法进行文本提取以便识别。当前的文档二值化一般采用基于阈值的方法,其大致可分为三大类:全局阈值法、局部阈值法和混合方法。全局阈值法仅通过一个全局阈值将前、背景区分开,速度较快。局部阈值法根据像素的局部领域窗口计算动态的局部阈值将该像素进行前、背景的划分,虽然相比于全局阈值法计算复杂度更高,但能更好地应对退化和质量较低的图像。
有一些文献使用概率图模型来进行文档二值化,比如文献[1]采用马尔科夫随机场模型(MRF)对文本像素和背景像素进行建模,通过最大化后验概率来判断像素属于前景还是背景。值得注意的是,有少量文献还考虑到了人机交互在二值化中的作用,即由用户标定少量像素来辅助二值化算法对整幅图像的像素进行分类,如文献[2]针对文字渗透(即水印)的问题,用户先标定少量属于文本、水印和背景的像素,然后再通过MRF模型对其它像素进行标定,但该方法没有考虑其它退化因素。文献[3]在采用多种二值化方法的同时将每种方法的结果都与用户提供的信息进行融合,从而更有效地利用用户交互信息。
总的来说,虽然该领域提出了很多二值化方法,但基本是针对具体问题进行的具体设计,直接应用于古籍文档,不能取得理想的结果,识别的准确度不能满足需求。
以下文献是与本发明相关的技术背景资料:
[1]T.Lelore,F.Bouchara,Document image binarization using Markov fieldmodel[C],Proc.10th Int'l Conf.on Document Analysis and Recognition(ICDAR2009),pp.551–555,2009.
[2]H.Yi,M.S.Brown,X.Dong,User-assisted ink-bleed reduction,IEEETrans.Image Process[J].19(10):2646–2658,2010.
[3]F.Deng,Z.Wu,Z.Lu,M.S.Brown,BinarizatioinShop:A userassistedsoftware suite for converting old documents to black-and-white[C].Proc.10thannual joint conference on Digital libraries,pp.255–258,2010
发明内容
为了解决现有技术中的上述问题,即为了解决古籍文档文本识别准确度较低的问题,本发明提供了一种基于图半监督学习的图像二值化处理方法,包括:
步骤S1,获取待处理的图像,作为第一图像;
步骤S2,对所述第一图像进行降采样,然后采用k近邻法构图,得到第二图像;将所述第二图像中的像素点作为结点;
步骤S3,通过边缘提取方法获取所述第二图像中前景和背景,并分别从前景和背景中选取离边缘提取法阈值最远的16%样本点作为标记的种子点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;富士通株式会社,未经中国科学院自动化研究所;富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811334371.8/2.html,转载请声明来源钻瓜专利网。