[发明专利]一种图像文档关键图案的提取方法无效

申请号：	201010225300.1	申请日：	2010-07-13
公开（公告）号：	CN101894154A	公开（公告）日：	2010-11-24
发明（设计）人：	房斌;陈睿;文静;唐远炎	申请（专利权）人：	重庆大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06K9/52
代理公司：	重庆市前沿专利事务所 50211	代理人：	余锦曦
地址：	400044 重***	国省代码：	重庆;85
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种图像文档关键图案提取方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种关键图案的提取方法，尤其设计一种字迹文档图像关键词提取技术领域。

背景技术

从手写字迹文档图像中提取关键词是一项重要的任务，它能够作为文本相关笔迹鉴别的预处理步骤，其实质是从数字图像中识别和定位目标物体。目标物体识别一般通过将目标物体模型的特征和数字图像中的检测到的实体的特征进行匹配的方式实现。学术界提出了大量基于整体和局部方法的能够抗旋转和位移的目标物体识别和定位的技术。整体方法基于整体特征，如边界和区域。这些方法包括不变矩、Fourier描述子和互相关。局部方法使用局部特征，包括关键点、局部最大曲率和多边形近似。

Hough变换是检测直线、圆和其它解析曲线的有效方法，它把目标的识别问题转化为对在参数空间投票多少的判定。

现有技术的缺点是：最初的Hough变换只能用来检测形状有解析表达式的目标。为了检测形状任意的、没有解析表达式的目标，人们提出了广义Hough变换(GHT)算法。GHT的实质也是让轮廓边界点进行投票，只是投票地点不是由表达式的参数确定，而是定义一个参考点和一套投票机制，通过投票的集中程度来判定目标的存在与否。

GHT解决了任意形状边界目标的识别，但它的缺点是：需要目标物体的完整轮廓边界点信息，难以从字迹文档图像中提取所有有效的关键词，难以可靠实现书写者身份鉴别。

发明内容

本发明的目的是提供一种图像文档关键图案的提取方法，利用改进的广义Hough变换从手写汉字文档图像中提取关键词，能够可靠实现书写者身份的鉴别。

为达到上述目的，本发明表述一种图像文档关键图案的提取方法，其关键在于按以下步骤进行：

一种图像文档关键图案的提取方法，其关键是按以下步骤进行：

一、获取源图像文档，并对在源图像文档进行二值化和骨架化处理，获得处理图像M，并在处理图像M中确定所要查阅的关键图案，并以其中一个关键图案作为模板S，模板S的长a和宽b由人工确定；

二、确定模板S的重心，在模板S中确定每个像素点在该模板S中的邻域方向角基准特征X’、重心夹角基准特征Y’和重心距离基准特征Z’，并用这些基准特征建立参考表；

三、采集处理图像M中每个图案像素的邻域方向角特征X，将每个图案像素的邻域方向角特征X与所述邻域方向角基准特征X’进行比较，找出与邻域方向角基准特征X’邻域方向角相匹配的匹配图案像素D；

四、引用参考表中的重心夹角基准特征Y’和重心距离基准特征Z’，并投射到所述匹配图案像素D上，用该匹配图案像素D的重心夹角和重心距离，在处理图像M中对关键图案的重心进行虚拟关键图案还原投票，定位出图像文档中所有的真实关键图案。

所述像素点邻域方向角的获取方法为：

第一步：确定图案像素点A的边长为r的正方形，其邻域是以点A为中心，边长为r的文档图像的子图像；

第二步：统计该子图像周边的邻域边界点，将相邻的边界点组成N个集合，即邻域边界点集；

第三步：以图案像素点A所在横轴正方为邻域方向角起始边，按逆时针旋转，每个邻域边界点集中点与图案像素点A的连线为邻域方向角终止边，获取每个邻域边界点集的方向角，其范围是[0，360)；

第四步：统计出图案像素A所有邻域边界点集的方向角，即该图案像素点A的N个图案像素邻域方向角。

所述每个图案像素在模板S中的重心夹角为：对于模板S中的每个字符像素横轴正方向和它与模板S重心连线构成的向量V沿逆时针方向所成夹角为重心夹角，即从横轴正方向开始，按逆时针方向旋转到V所经过的角度，其范围是[0，360)。

所述每个图案像素在模板S中的重心距离为：每个字符像素点到模板S重心的距离长度。

所述模板S重心为：该模板S中所有像素点X向坐标和的平均值，所有像素点Y向坐标和的平均值。

所述参考表为：邻域方向角基准特征X’、重心夹角基准特征Y’和重心距离基准特征Z’，其中邻域方向角基准特征X’包含N个值，它们构成了参考表中的一行；

在匹配过程中，对文档图像中的每个字符像素点提取N个邻域方向角特征，用这些方向角与参考表中每一行的对应方向角的值进行比较，如果匹配度大于设定阈值，则在文档图像中用重心夹角和重心距离进行虚拟关键图案还原投票，最终根据票数在参数空间中形成局部峰值，定位出真实关键图案的位置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆大学，未经重庆大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201010225300.1/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种图像文档关键图案的提取方法无效

专利文献下载