[发明专利]一种基于熵值校验的表格图像区域识别方法及系统在审
申请号: | 202110490611.9 | 申请日: | 2021-05-06 |
公开(公告)号: | CN113191277A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 苏琳 | 申请(专利权)人: | 北京惠朗时代科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06F17/18 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100176 北京市大兴区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 校验 表格 图像 区域 识别 方法 系统 | ||
本发明提出了一种基于熵值校验的表格图像区域识别方法及系统,涉及图像识别领域。一种基于熵值校验的表格图像区域识别方法包括:根据HOG对多个表格图像区域和待识别图像区域进行特征提取,然后利用欧式距离计算待识别图像区域和多个表格图像区域的特征相似性度量;通过熵值计算公式求得待识别图像区域的熵值;根据第一预设条件判定待识别图像区域是否为表格图像区域;其能够通过特征相似性检验及熵值检验模型对表格图像区域识别有较强的针对性,可以显著地提升表格图像区域识别的精度。此外本发明还提出了一种基于熵值校验的表格图像区域识别系统,包括:特征相似度模块、区域熵模块及结果模块。
技术领域
本发明涉及图像识别领域,具体而言,涉及一种基于熵值校验的表格图像区域识别方法及系统。
背景技术
随着科技的进步,很多论文、报告书、合同等文件经常出现在我们的生活中,它们也经常以图片的形式在网络中传输、共享或者展示。在论文、报告书、合同中,表格往往是其中非常重要的部分。如果想要对图像中的表格及相关内容进行识别、编辑,能够精准地判别出表格图像区域是非常重要的一个环节。
针对上述问题,很多专家和学者进行了较为深入的研究。但传统的表格图像区域识别方法往往没有针对性,没有充分考虑表格图像区域的特异性,导致了表格图像区域的识别精度不高。同时,多数传统方法往往利用了较为复杂的模型或者利用了较多的训练样本,大大增加了计算资源的消耗。因此,如何设计一种针对性较强的简易表格图像区域识别方法,能够利用较低的资源消耗较高精度地识别出表格图像区域是一个非常有意义且亟待解决的问题。
发明内容
本发明的目的在于提供一种基于熵值校验的表格图像区域识别方法,其能够通过特征相似性检验及熵值检验模型对表格图像区域识别有较强的针对性,可以显著地提升表格图像区域识别的精度,整个模型中用的算法相对较为简易,相比于其它复杂方法或者基于大量训练样本的方法,可以有效地减少计算资源的消耗。
本发明的另一目的在于提供一种基于熵值校验的表格图像区域识别系统,其能够运行一种基于熵值校验的表格图像区域识别方法。
本发明的实施例是这样实现的:
第一方面,本申请实施例提供一种基于熵值校验的表格图像区域识别方法,其包括根据HOG对多个表格图像区域和待识别图像区域进行特征提取,然后利用欧式距离计算待识别图像区域和多个表格图像区域的特征相似性度量;通过熵值计算公式求得待识别图像区域的熵值;根据特征相似性度量及待识别图像区域的熵值的第一预设条件判定待识别图像区域是否为表格图像区域。
在本发明的一些实施例中,还包括:计算多个表格图像区域和待识别图像区域的长宽比,并利用绝对差值计算待识别图像区域和表格图像区域的长宽比相似性。
在本发明的一些实施例中,还包括:判断相似性待识别图像区域和多个表格图像区域中任意一个表格图像区域的长宽比相似性是否满足第二预设条件,若满足,则判定待识别图像区域为准表格图像区域继续下一步判定,若不满足,则判定待识别图像区域为非表格图像区域。
在本发明的一些实施例中,上述第二预设条件包括:判断待识别图像区域和任意一个表格图像区域的长宽比相似性度量满足第一预设值。
在本发明的一些实施例中,上述通过熵值计算公式求得待识别图像区域的熵值包括:计算待识别图像区域中每个像素点的灰度值,并计算任意一个灰度值在该图像中出现的概率,通过预设公式对区域熵进行计算。
在本发明的一些实施例中,上述通过预设公式对区域熵进行计算包括:利用公式对区域熵进行计算,其中,H为区域熵,P为灰度概率,i为灰度值。
在本发明的一些实施例中,上述根据第一预设条件判定待识别图像区域是否为表格图像区域包括:判断待识别图像区域和任意一个表格图像区域的特征相似性度量是否满足第二预设值,及待识别图像区域熵值是否满足第三预设值,若同时满足,则判定待识别图像区域为表格图像区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠朗时代科技有限公司,未经北京惠朗时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110490611.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序