[发明专利]一种文档图像视觉效果的优化方法及系统在审
| 申请号: | 201810981513.3 | 申请日: | 2018-08-27 |
| 公开(公告)号: | CN109214322A | 公开(公告)日: | 2019-01-15 |
| 发明(设计)人: | 刘嘉;张旗川 | 申请(专利权)人: | 厦门哲林软件科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/40;G06K9/62 |
| 代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 连耀忠;李艾华 |
| 地址: | 361000 福建省*** | 国省代码: | 福建;35 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档图像 视觉效果 文本区域 背景处理 背景区域 底色区域 图形图像 文本笔画 优化 光学文字识别 合成背景图像 背景图像 图像处理 图像叠加 原始图像 灰度级 拉伸 图像 检测 | ||
1.一种文档图像视觉效果的优化方法,其特征在于,包括:
对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域;
对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域;
进行背景处理,合成背景图像;所述进行背景处理包括对底色区域和背景区域进行处理;
对所述图形图像区域和文本笔画区域进行灰度级拉伸,再将处理后的图像叠加到所述背景图像上。
2.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:
对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域;
基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域。
3.根据权利要求2所述的文档图像视觉效果的优化方法,其特征在于,对所述文档图像进行局部阈值二值化处理,基于二值图像判断出所述文档图像中的前景区域和背景区域,具体包括:
对所述文档图像中的每个像素点进行处理,得到二值图像;其中,二值图像中像素值为1的点属于前景区域,二值图像中像素值为0的点属于背景区域。
4.根据权利要求2所述的文档图像视觉效果的优化方法,其特征在于,所述基于训练好的分类器对所述前景区域进行识别判断,检测出所述前景区域中的文本区域和图形图像区域,具体包括:
构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;
将预设大小的窗口滑过前景区域,利用训练好的分类器对窗口内图像的类别进行判断,滑动窗口直到获得前景区域中每个像素点的判断结果,检测出所述前景区域中的文本区域和图形图像区域。
5.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,所述对输入的文档图像进行识别判断,检测出图像中的文本区域、图形图像区域和背景区域,具体包括:
构建多层卷积神经网络作为分类器,并利用有标记的样本数据训练分类器;
将预设大小的窗口滑过文档图像,利用训练好的分类器对窗口内图像区域的类别进行判断,继续滑动窗口直到获得整幅文档图像每个像素点的判断结果;所述类别包括文本区域、图形图像区域和背景区域。
6.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,对所述文本区域进行处理,判断出文本区域中的底色区域和文本笔画区域,具体包括:
对所述文本区域中的每个像素点进行处理,得到二值图像;其中,二值图像中像素值为1的点属于文本笔画区域,二值图像中像素值为0的点的属于底色区域。
7.根据权利要求1所述的文档图像视觉效果的优化方法,其特征在于,所述进行背景处理,合成背景图像,具体包括:
利用纯色作为背景图像,或者,提取背景纹理,调整背景灰度级作为背景图像。
8.根据权利要求7所述的文档图像视觉效果的优化方法,其特征在于,所述提取背景纹理,调整背景灰度级作为背景图像,包括:
将文档图像转到HSV颜色空间;
提取图像V通道的亮度值,得到亮度图像G;
对G进行指定窗口大小的中值滤波,得到背景平均灰度级图像J;
亮度调整,将G中每个像素的灰度级减去J中对应像素的灰度级,再与一个参考的灰度级b求和,得到背景亮度图像K;
将文档图像V通道的亮度图像替换成K,将图像从HSV空间转到RGB颜色空间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门哲林软件科技有限公司,未经厦门哲林软件科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810981513.3/1.html,转载请声明来源钻瓜专利网。





