[发明专利]用于智能无线通信终端的四边形边框识别方法及装置有效
申请号: | 201310330784.X | 申请日: | 2013-08-01 |
公开(公告)号: | CN103399695A | 公开(公告)日: | 2013-11-20 |
发明(设计)人: | 龙腾;王跃;沈东辉;李平新;胡明 | 申请(专利权)人: | 上海合合信息科技发展有限公司 |
主分类号: | G06F3/0484 | 分类号: | G06F3/0484;G06F3/0487 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200433 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 智能 无线通信 终端 四边形 边框 识别 方法 装置 | ||
技术领域
本发明涉及一种图像识别方法,尤其是一种用于智能无线通信终端的四边形边框识别方法。本发明还涉及一种图像识别装置,尤其是一种用于智能无线通信终端的四边形边框识别方法。
背景技术
目前,在商务设备如扫描仪,商务手机上,开始越来越多的出现对所拍摄图片的信息进行加工和提取的功能。这些功能一般可归结为两类。
1. 白板图像的校正和增强
白板图像是对会议白板,公告牌和其他文本类矩形目标拍摄所得的图像。白板图像中用户感兴趣的信息一般在矩形区域内,而拍摄所得的图片,首先在目标矩形区域之外会有不需要的边缘区域,其次因为拍摄角度的问题,目标矩形区域可能会出现不规则四边形(如图1),或者缺角(如图2)的情况。通过对图像的处理,将目标区域之外的部分去除,并将不规则四边形变形为规则的矩形(如图3),或者将缺角部分填平(如图4),并将彩色图像转换为黑白图像,并做图像增强操作,使文字更加清晰。
2. 对文本图像中文本的识别
文本图像是对标准文本,如A4格式纸质文本,各种书籍中的页面,电影海报等进行拍摄所得的图像。文本识别是通过文本识别引擎,对文本图像数据进行处理,识别出图像中的文本。文本图文本内容一般显示在矩形区域内,而拍摄所得的图片,在目标矩形区域之外会有不需要的边缘区域,其次因为拍摄角度的问题,目标矩形区域可能会出现不规则四边形(如图1),或者缺角(如图2)的情况。为了使文本识别引擎对文本图像的识别更加准确迅速,需要通过对图像的处理,将目标区域之外的部分去除,并将不规则四边形变形为规则的矩形(如图3),或者将缺角部分填平(如图4),并将彩色文木图像转换为黑白图像,并做图像增强操作,使图像中的文字和背景的对比更加明显。
上述两类操作都需要做四边形框检测操作。四边形框检测操作是指对所拍摄的图像进行检测,提取目标四边形框,从而在之后的操作中,去除四边形框以外的区域,并对该四边形框进行矩形框校正或补角操作。然而在实际操作中,自动检测所得的四边形框范围可能不是期望结果,如图5,原本目标框的是虚线范围内的部分,但实际检测到的是实线范围部分;或者如图6,源图中有多个框可供抓取,目标框是左侧虚线范围部分,但实际检测到的是右侧实线范围部分。因此,在对图像进行初次检测时候,需要提供一个交互界面供用户做目标框的调整。
公开号为CN101807293A的中国发明专利公开文本中,公开了一种调整图像四边形框检测结果的方法,通过手动拉伸来选择图像中的四边形部分。但是,这种部分操作起来较为繁琐,需要对四个顶点的位置分别进行确定,之后才完成对一个四边形边框的选择。
发明内容
本发明所要解决的技术问题是提供一种用于智能无线通信终端的四边形边框识别方法,以及采用这种用于智能无线通信终端的四边形边框识别方法实现的四边形边框识别装置,让使用者能够快速准确地调整四边形边框,以使调整后的四边形框能够进行接下来的处理,最终得到使用者预期得到的结果图像或结果文本信息。
为解决上述技术问题,本发明用于智能无线通信终端的四边形边框识别方法的技术方案是,包括以下步骤:
第一步,获取待处理的图像;
第二步,根据图像显示的内容,在图像中的一个或多个四边形轮廓上预设相应的四边形边框,所述四边形具有四个顶点,其四条边线或者都是直线,或者至少有一条边线是曲线;
第三步,根据用户的选择位置,当用户选择位置在某一四边形边框的附近时,选中该某一四边形边框,所述附近是指二者之间的距离在相互靠近过程中符合预先设定的规则;
第四步,对与选中的四边形边框相关的图像部分进行处理。
本发明还提供了一种四边形边框识别装置,其技术方案是,基于智能无线通信终端,并采用上述用于智能无线通信终端的四边形边框识别方法。
本发明采用上述技术方案,利用人机界面交互的技术,在通过图像引擎获取目的框后,通过鼠标,触摸笔或手指在全屏幕范围内的点触,自动以最优化的方式获取最佳目标候选四边形框,不需要用户一个一个点的去确定四边形的顶点,减少用户的操作次数;此外如果用户预置图像中的内容,可以在图像引擎获取目的框后直接快速确定四边形框,不需要用户拖动顶点或者拖动边,用户的干预更加少,大大简化了用户操作和降低使用难度。
附图说明
下面结合附图和实施例对本发明作进一步详细的说明:
图1-图4是白板和文本拍摄和处理后图像的示意图;
图5和图6是抓框后目的框需要再调整的示意图;
图7和图8是本发明实施例的示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海合合信息科技发展有限公司,未经上海合合信息科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310330784.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于治疗肾结石的中药组合物及其应用
- 下一篇:一种拼音输入法切换方法