[发明专利]经由用于梵文光学字符辨识的基于前缀树的解码来处置字的复杂变体的方法在审
申请号: | 201380036713.7 | 申请日: | 2013-06-29 |
公开(公告)号: | CN104428790A | 公开(公告)日: | 2015-03-18 |
发明(设计)人: | K·K·巴曼;P·K·拜哈提;R·K·克里希纳·库马尔 | 申请(专利权)人: | 高通股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/72;G06K9/68 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 宋献涛 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 经由 用于 梵文 光学 字符 辨识 基于 前缀 解码 处置 复杂 变体 方法 | ||
优先权申请的交叉引用
本申请案主张来自2012年7月30日申请的且题为“经由用于梵文光学字符辨识的基于前缀树的解码来处置字的复杂变体的方法(Method Of Handling Complex Variants Of Words Through Prefix-Tree Based Decoding For Devanagiri OCR)”的第61/677,291号美国临时申请案的优先权,所述临时申请案已转让给本案受让人,且以全文引用的方式并入本文中。
本申请案主张来自2012年7月19日申请的且题为“具有逆向遍次的基于网格的字解码器(Trellis based word decoder with reverse pass)”的第61/673,606号美国临时申请案的优先权,所述临时申请案已转让给本案受让人,且以全文引用的方式并入本文中。
本申请案主张来自2013年3月14日申请的且题为“经由用于梵文光学字符辨识的基于前缀树的解码来处置字的复杂变体的方法(Method Of Handling Complex Variants Of Words Through Prefix-Tree Based Decoding For Devanagiri OCR)”的第13/828,060号美国申请案的优先权,所述申请案已转让给本案受让人,且以全文引用的方式并入本文中。
以引用的方式并入的美国申请案的交叉引用
本申请案涉及2013年3月14日申请且题为“具有逆向遍次的基于网格的字解码器(Trellis based word decoder with reverse pass)”的第13/829,960号美国申请案,所述申请案转让给本受让人且以引用的方式并入本文中。
技术领域
本专利申请案涉及用于在自然图像或视频帧中识别文字的字的装置及方法。
背景技术
识别经光学扫描(例如通过光复印机的平面扫描器)的纸中的文字区域显著比在可在图像(也称为“自然图像”)中捕捉的或在由具有内置式数码相机的手持式装置(例如智能电话)实时捕捉的视频帧中的现实世界的场景中检测可能含有文字的区域更容易(例如,由于竖直定向、大的尺寸及缓慢速度)。具体来说,现有技术的光学字符辨识(OCR)方法来源于文档处理领域,其中文档图像在文档中含有光学扫描页面的一连串文字行(例如30行文字)。
文档处理技术虽然成功地用于光学扫描器所产生的扫描文档,但产生了太多的假阳性及/或假阴性以致在用于含有文字的自然图像时为不实用的。因此,使用不同技术来执行由手持式相机产生的现实世界图像中的文字区域的检测。关于用于现有技术中的技术的额外信息,为了识别自然图像中的文字区域,参见以引用的方式全文并入本文中作为背景的以下论文:
(a)丽(LI)等人,“数字视频中的自动文字检测及跟踪”,关于图像处理的IEEE学报,2000年1月,第147-156页,第9卷,第1期;
(b)陈(CHEN)等人,“检测及读取自然场景中的文字”,关于计算机视觉及图案辨识的IEEE计算机社会会议(CVPR′04),2004年,第1-8页;
(c)李(LEE)等人,“用于字符分段及辨识的新方法”,关于模式分析及机器智能的IEEE学报,1996年10月,第1045-1050页,第18卷,第10期;
(d)爱波斯坦(EPSHTEIN)等人,“使用笔划宽度变换来检测自然场景中的文字”,计算机视觉及图案辨识(CVPR)2010年,第2963-2970页(下载自“http://research.microsoft.com/pubs/149305/1509.pdf”);及
(e)贾恩(JAIN)等人,“图像及视频帧中的自动文字定位”,图案辨识,1998年,第2055-2076页,第31卷,第12期。
上文描述的现有技术的图像处理技术似乎主要经开发以识别图像中的含有以英语书写的文字的区域。使用此类技术以在自然图像中识别其它语言的文字区域(针对其字母表的字母使用不同的手迹)可产生假阳性及/或假阴性以致使得所述技术不实用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380036713.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:弹簧驱动的注射装置
- 下一篇:含有紫外线辐射吸收性聚酯的防晒剂组合物