[发明专利]基于图半监督学习的文档二值化处理方法、系统、装置有效
申请号: | 201811334371.8 | 申请日: | 2018-11-09 |
公开(公告)号: | CN109460735B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 殷飞;吴金文;孙俊;刘成林 | 申请(专利权)人: | 中国科学院自动化研究所;富士通株式会社 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 监督 学习 文档 二值化 处理 方法 系统 装置 | ||
1.一种基于图半监督学习的图像二值化处理方法,其特征在于,包括:
步骤S1,获取待处理的图像,作为第一图像;
步骤S2,对所述第一图像进行降采样,然后采用k近邻法构图,计算降采样后的图像的k*gap半径范围内的像素点和中心像素点之间的权重,并以所述权重作为像素点之间的相似度生成第二图像;所述权重为降采样后的图像的k*gap半径范围内的像素点和中心像素点之间的RGB三通道的欧式距离;将所述第二图像中的像素点作为结点;其中,k为设定的k近邻法的近邻数,gap为采样后水平和竖直方向相邻结点像素中心之间的像素距离;
步骤S3,通过边缘提取方法获取所述第二图像对应的边缘图像,并计算所述第二图像的局部对比度,获得所述第二图像对应的对比度图,基于所述边缘图像和对比度图确定字符边缘,并通过连通区域统计字符平均大小,以平均尺寸作为局部区域的大小设置滑动窗口进行阈值分割,获得所述第二图像的前景和背景,并分别从前景和背景中选取样本点作为标记的种子点;
步骤S4,基于所述标记的种子点以及所述第二图像的结点之间的权重,通过最小树生成法进行结点重新连接,并构建最小能量函数,采用图半监督学习方法迭代优化所述最小能量函数,并通过求解最优最小能量函数中的分类函数对所述第二图像中像素点进行分类,获取前景结点和背景结点;
步骤S5,基于步骤S4获取的前景结点、步骤S3中降采样的像素间距,进行前景像素点的恢复,得到第三图像;
步骤S6,对所述第三图像进行二值化,得到二值化的图像。
2.根据权利要求1所述的基于图半监督学习的图像二值化处理方法,其特征在于,所述步骤S5中前景像素点的恢复之后还包括所述第三图像的修正步骤,包括:
步骤S521,获取修正信息;所述修正信息为基于所述第三图像中分类错误的像素点,对所述第二图像对应像素分类修正;
步骤S522,从所述修正信息中选取样本点增入对应类别的标记的种子点,并执行步骤S4。
3.根据权利要求1所述的基于图半监督学习的图像二值化处理方法,其特征在于,所述第二图像G=(V,E),其中V表示结点集{x1,...,xl,xl+1,...,xl+u},其中,l为步骤S3中获取的作为标记的种子点数量,u为除标记的种子点之外的样本点数量;E是所述第二图像G的边集,边集权重W为基于高斯函数定义的亲和矩阵,该矩阵中的元素(W)ij通过下式获取:
式是第i结点和第j结点的RGB三通道的欧氏距离,其中,
4.根据权利要求3所述的基于图半监督学习的图像二值化处理方法,其特征在于,步骤S4中“采用图半监督学习方法对所述第二图像中结点进行分类”,其方法为:
步骤S41,利用所述第二图像中前景的边集,将所述第二图像中的结点变为单连通;
步骤S42,采用迭代的方式优化最小能量函数E(f),获取未标记样本的分类,
E(f)=fT(D-W)f+(f-y)TC(f-y)
f=(flTfuT)T,其中,fl为有标记样本,fu为未标记样本上的预测结果,D表示对角阵diag(d1,d2,...,dl+u),di表示亲和矩阵W的第i行的元素之和,C为常数对角矩阵,其中Cii≥0,y为样本的标记信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;富士通株式会社,未经中国科学院自动化研究所;富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811334371.8/1.html,转载请声明来源钻瓜专利网。