[发明专利]图像中的字段提取方法及装置有效
申请号: | 201210551500.5 | 申请日: | 2012-11-29 |
公开(公告)号: | CN103854019B | 公开(公告)日: | 2018-11-30 |
发明(设计)人: | 郑大念 | 申请(专利权)人: | 捷讯平和(北京)科技发展有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 上海隆天律师事务所 31282 | 代理人: | 臧云霄;钟宗 |
地址: | 100015 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 中的 字段 提取 方法 装置 | ||
本发明的实施方式提供了一种字段提取方法,包括:提取图像中的文字区域的像素;统计文字区域的像素的颜色,将文字区域的像素按颜色划分为若干个聚类;对文字区域的像素进行连通域分析,并对识别出的每个像素连通区域的像素设定一种颜色,该设定的颜色对应该连通区域中的像素所属聚类的颜色;对像素连通区域进行文本行识别,将同在一个文本行中且颜色相同的像素连通区域判定为一个字段。该方法能够简单、准确的从文字区域中提取出每个字段。
技术领域
本发明的各实施方式涉及图像中的字段提取方法及装置,尤其是彩色图像中的字段提取方法及装置。
背景技术
对图像中的文字进行识别已经是公知的技术。但是对于彩色图像中的文字进行识别却相对困难。图像背景中的色彩可能会对文字区域的提取带来干扰,尤其是图像中同时出现文字区域比背景浅和文字区域比背景深的情况下,将所有文字区域从图像中提取出来是非常困难的。
现有的光学字符识别只能将图像中的所有文字识别出来,而无法对这些文字按照不同含义拆分成若干字段。在对名片中的文字进行识别时,往往希望对表示一个含义的一个字段进行提取,以便对不同字段的信息分别进行存储。而彩色名片中往往将表示不同含义的字段使用不同颜色印刷。这为从图像中提取字段提供了一个途径。
发明内容
鉴于上述原因,本发明提供一种字段提取方法及装置。
根据本发明的一个方面,提供一种字段提取方法,包括:提取图像中的文字区域的像素;统计文字区域的像素的颜色,将文字区域的像素按颜色划分为若干个聚类;对文字区域的像素进行连通域分析,并对识别出的每个像素连通区域的像素设定一种颜色,该设定的颜色对应该连通区域中的像素所属聚类的颜色;对像素连通区域进行文本行识别,将同在一个文本行中且颜色相同的像素连通区域判定为一个字段。
根据本发明的另一方面,在提取图像中的文字区域的像素的步骤中,分别在R、G、B三个色彩通道提取文字区域的像素,并把该三个通道上的文字区域的像素合并得到该图像中的文字区域的像素。
根据本发明的另一方面,在每个色彩通道提取文字区域时,先将该通道下的图像转换为灰度图像,再转换成二值图像,从该二值图像中提取文字区域的像素;然后将该通道下的图像反色后,再将该反色图像转换为灰度图像和二值图像,并从中提取文字区域的像素;将该两次提取的像素合并作为该通道下的文字区域的像素。
根据本发明的另一方面,在统计文字区域的像素的颜色的步骤中,使用K均值聚类或C均值聚类方法对文字区域的像素按颜色进行聚类。
根据本发明的另一方面,所述设定的颜色为像素连通区域的各像素所属比例最高的聚类的颜色。
根据本发明的另一方面,提供一种字段提取装置,包括:文字区域提取单元,用于提取图像中的文字区域的像素;像素聚类单元,用于统计文字区域的像素的颜色,将文字区域的像素按颜色划分为若干个聚类;连通区域处理单元,用于对文字区域的像素进行连通域分析,并对识别出的每个像素连通区域的像素设定一种颜色,该设定的颜色对应该连通区域中的像素所属聚类的颜色;字段判定单元,对像素连通区域进行文本行识别,将同在一个文本行中且颜色相同的像素连通区域判定为一个字段。
根据本发明的另一方面,文字区域提取单元分别在R、G、B三个色彩通道提取文字区域的像素,并把该三个通道上的文字区域的像素合并得到该图像中的文字区域的像素。
根据本发明的另一方面,文字区域提取单元在每个色彩通道提取文字区域时,先将该通道下的图像转换为灰度图像,再转换成二值图像,从该二值图像中提取文字区域的像素;然后将该通道下的图像反色后,再将该反色图像转换为灰度图像和二值图像,并从中提取文字区域的像素;将该两次提取的像素合并作为该通道下的文字区域的像素。
根据本发明的另一方面,像素聚类单元使用K均值聚类或C均值聚类方法对文字区域的像素按颜色进行聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于捷讯平和(北京)科技发展有限公司,未经捷讯平和(北京)科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210551500.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:抽拉牙刷
- 下一篇:用于P/F运输线上C形钩的信息跟踪装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序