[发明专利]用于从图像确定文本信息的并行处理方法和设备在审

专利信息
申请号: 201280029600.X 申请日: 2012-07-03
公开(公告)号: CN103608823A 公开(公告)日: 2014-02-26
发明(设计)人: 延奇宣;丘衡一;朝玄默 申请(专利权)人: 高通股份有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/38;G06K9/03;G06K9/32
代理公司: 北京律盟知识产权代理有限责任公司 11287 代理人: 宋献涛
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 图像 确定 文本 信息 并行 处理 方法 设备
【说明书】:

相关申请案的交叉参考

本申请案主张2011年7月8日申请的第61/505,984号美国临时专利申请案以及2012年7月2日申请的第13/539,797号美国非临时申请案中的每一者的优先权,且以引用的方式并入。

技术领域

本发明大体上涉及处理图像。更具体来说,本发明涉及通过并行处理通道从多通道图像产生文本信息。

背景技术

数字图像可含有多种对象,例如包含字符、数字和符号的文本对象以及非文本对象。在这些对象中,文本对象可提供上下文信息,这对于用户是特别有意义和有用的。常规的算法常使用常使用标量像素值来处理此些数字图像。举例来说,包含SIFT(尺度不变特征变换)和MSER(最稳定外部区)的常规算法已用于基于标量像素值来检测数字图像中的文本对象。

如今使用的大多数数字图像是彩色图像。彩色图像通常包含色彩信息,例如图像中的每一像素的RGB值、CMY值或色调、亮度和色度值的组合。一股来说,数字彩色图像中的色彩是由多维向量(例如,RGB值或CMY值)表示。因此,使用处理图像的标量值的常规算法一股不适合辨识彩色图像中的文本对象。替代地,已经使用使用彩色图像中的像素的向量值来辨识文本对象的算法,例如MSCR(最稳定色彩区)。然而,此些基于向量的算法一股比基于标量的算法复杂得多并且需要多得多的计算资源。

为了减少复杂度和计算资源,常规的方案已经使用基于标量的算法来提高彩色图像中的处理速度。举例来说,通过将原始彩色图像转换为具有标量像素值的图像而从原始彩色图像辨识出文本对象中的个别字符。然而,此过程可导致一些文本对象与其背景之间的对比度的损失,使得可能不会正确地辨识出文本对象中的字符。

发明内容

本发明提供用于处理多通道图像以产生与所述多通道图像相关联的文本信息的方法和设备。在这些方法和设备中,从所述多通道图像产生多个灰度级图像。随后通过并行地处理所述灰度级图像而产生文本信息。

根据本发明的一个方面,揭示一种用于处理多通道图像的方法。所述方法包含从所述多通道图像产生多个灰度级图像。在所述多个灰度级图像中识别至少一个文本区,且从所述至少一个文本区确定文本区信息。所述方法随后基于所述文本区信息而产生所述多通道图像的文本信息。本发明还描述与此方法相关的设备、装置的组合,以及计算机可读媒体。

根据本发明的另一方面,揭示一种用于处理多通道图像的设备。所述设备包含至少一个图像转换器、多个文本区检测器以及一合并单元。所述至少一个图像转换器从所述多通道图像产生多个灰度级图像。所述多个文本区检测器经配置以在所述多个灰度级图像中识别至少一个文本区,且从所述至少一个文本区确定文本区信息。通过所述合并单元基于所述文本区信息而产生所述多通道图像的文本信息。

根据本发明的又一方面,揭示用于处理多通道图像的另一方法。所述方法从所述多通道图像产生第一和第二灰度级图像。在所述第一灰度级图像中识别第一文本区且在所述第二灰度级图像中识别第二文本区。另外,分别从所述第一文本区和所述第二文本区确定第一和第二文本区信息。所述方法基于所述第一和第二文本区信息而产生所述多通道图像的文本信息。本发明还描述与此方法相关的设备、装置的组合,以及计算机可读媒体。

根据本发明的再一方面,揭示用于处理多通道图像的另一设备。所述设备包含至少一个图像转换器、第一文本区检测器和第二文本区检测器以及合并单元。所述至少一个图像转换器从所述多通道图像产生第一和第二灰度级图像。所述第一文本区检测器经配置以在所述第一灰度级图像中识别第一文本区且从所述第一文本区确定第一文本区信息。所述第二文本区检测器经配置以在所述第二灰度级图像中识别第二文本区且从所述第二文本区确定第二文本区信息。通过所述合并单元基于所述第一和第二文本区信息而产生所述多通道图像的文本信息。

附图说明

图1说明根据本发明的一个实施例的经配置以接收图像且从所接收的图像产生文本信息的图像处理设备。

图2说明根据本发明的一个实施例的经配置以接收图像且从所接收的图像产生文本信息的另一图像处理设备。

图3说明根据本发明的一个实施例的经配置以接收图像且从所接收的图像产生文本信息的又一图像处理设备。

图4表示根据本发明的一个实施例的由图像处理设备执行的用于接收图像且从所接收的图像产生文本信息的方法的流程图。

图5说明根据本发明的一个实施例的使用并行布置的处理通道从多通道图像产生文本信息的图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280029600.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top