[发明专利]一种藏文古籍文档图像版面分割、识别方法及系统在审
申请号: | 202110526750.2 | 申请日: | 2021-05-14 |
公开(公告)号: | CN113516041A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 王维兰;陈园园;王筱娟;郝玉胜 | 申请(专利权)人: | 西北民族大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06T7/11 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 韩雪梅 |
地址: | 730030 甘肃省兰州市*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 藏文 古籍 文档 图像 版面 分割 识别 方法 系统 | ||
本发明涉及一种藏文古籍文档图像版面分割、识别方法及系统,所述方法包括:构建藏文古籍文档图像版面分割数据集;基于所述藏文古籍文档图像版面分割数据集对深度卷积神经网络进行训练;基于训练好的深度卷积神经网络对藏文古籍图像版面进行分割;对分割后的藏文古籍图像版面中的文本进行识别。本发明中的上述方法能够实现对藏文古籍文档图像进行精确分割和文字识别。
技术领域
本发明涉及文字识别领域,特别是涉及一种藏文古籍文档图像版面分割、识别方法及系统。
背景技术
在过去的几十年中,文档图像版面分析工作在多文种、多字体上展开,国内外的研究者针对印刷或手写的古籍文献提出了许多不同的版面分析方法。传统方法方面有:1)基于纹理的分析、2)游程平滑算法、3)投影轮廓切割算法、4)空白区域分析法、5)连通域分析法、6)Voronoi图分析法。深度学习方法方面,此类方法从图像像素出发利用卷积神经网络(CNN)生成图像的多层特征,利用提取的特征搭建合适的模型结构,并选择相应的损失函数,在大量的监督数据下通过最优化损失函数学习模型中的参数。此外,在版面分析系统研究方面,S.Pletschacher等于2010年发布用于页面分析和页面基本元素格式化的框架,随之发布版面分析系统Aletheia,并在不断扩充支持的语言。Supachai Tangwongsan等构建了一个高效的文档页面布局提取系统。
对于藏文文档图像版面分析技术,国内外仅有少数研究者对藏文古籍图像版面分析做了一些研究。其中,Ma等人研究出一种应用于藏文历史文档图像分割和识别的框架。提出基于块投影的版面分割方法,将藏文文档图像分割成文本、线条和框架,利用基于图模型的文本行分割方法解决文本与边框之间的粘连问题。Liu等人提出一种基于边界信息的藏文历史文献的版面分析方法,采用中值滤波、高斯平滑、Sobel边缘检测和边缘平滑、去除小区域、获取边界位置等一系列处理,根据边界和区域之间的位置关系,确定各个区域位置,例如文本区域、左注释、右注释等,最后以XML页面信息的格式保存文档图像。Zhang等人提出一种基于连通分量分析和角点检测的历史藏文文档图像文本提取方法,利用关联成分把藏文历史古籍的文档区域划分为三类,将图像等分为网格,利用连通域分类信息和角点密度信息对网格进行滤波,计算垂直和水平网格投影,通过投影分析,可以检测出文本区域的大致位置,通过校正近似文本区域的包围盒,准确地提取文本区域。Duan等人给出一种基于块投影的历史藏文文档图像文本提取方法,将图像平均分块,并根据连通分量的类别和角点密度信息进行滤波,通过块投影分析,找到近似的文本区域,并提取文本区域。以上研究利用传统方法解决了部分藏文古籍文档图像的版面分割问题,取得了良好的效果。但是这种针对特定藏文古籍文档图像版面的传统分割方法,不具备良好的鲁棒性,在遇到其它类型的版面时也不易迁移。
由于藏文古籍的固有特点,文本和边框、文本和图形之间通常会有粘连的情况发生,版面也较为复杂,页面包括文本块、图像、边框、左右标题等,古籍图像颜色不一致、噪点多,同时藏文古籍中的不同边框线经常会出现弯曲、倾斜、断裂,以及边框线和文字粘连等情况。以上这些特点给实现高性能的藏文古籍图像的版面分割及描述带来了较大挑战。而现有的文档版面分析方法主要有以下缺点:1)大部分是对近现代比较规则的印刷书籍的版面进行分析,其方法不适用于版面较复杂的历史文档;2)已有的历史文档的版面分析方法,大多是针对某一种语言文字的历史文档特点提出的方法,并不完全适用于藏文古籍。
本发明旨在利用传统方法与深度学习方法相结合的混合策略,解决藏文古籍文档图像的版面分割及识别问题。
发明内容
本发明的目的是提供一种藏文古籍文档图像版面分割、识别方法及系统,提高分割精度。
为实现上述目的,本发明提供了如下方案:
一种藏文古籍文档图像版面分割、识别方法,所述方法包括:
构建藏文古籍文档图像版面分割数据集;
基于所述藏文古籍文档图像版面分割数据集对深度卷积神经网络进行训练;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北民族大学,未经西北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110526750.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序