[发明专利]一种预览图像手动缩放进行字符查询的方法及装置在审
申请号: | 201710600705.0 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107438160A | 公开(公告)日: | 2017-12-05 |
发明(设计)人: | 孔祥顺;杨大友 | 申请(专利权)人: | 上海明数数字出版科技有限公司 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;G06F3/0485;G06F3/0486;G06F3/0488;G06K9/20 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201203 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预览 图像 手动 缩放 进行 字符 查询 方法 装置 | ||
技术领域
本发明涉及一种字符查询方法,具体为一种手动控制摄像头缩放进行快速字符查询的方法,本发明还提供了该字符查询方法对应的查询装置,特别地,本发明还提供了一种手动触控摄像头缩放预览的方法。
背景技术
近年来,随着相机在智能移动终端上的应用越来越多,基于相机拍摄的图像文本结合文字识别技术进行文字输入的应用也越来越广泛,如基于相机的名片识别技术,图像文本分析和识别技术等。
在日常生活中,人们经常需要通过查字典来查找一个中文词语对应的英文单词或其他语言的单词。现在,各种电子字典已经广泛应用于手机等智能移动终端中,利用手机就可以随时随地的进行字符的相关查询,给人们的日常生活提供方便。
现有的智能移动终端上的电子字典,其查询方法通常采用键盘输入、手写识别输入、语音识别输入及图片识别输入,图片识别输入是利用移动终端的摄像头实时拍摄的图像或输入的图片实时取词并利用光学字符识别技术(OCR)识别选取的字符,对识别的字符进行输入查询,操作上更方便,应用上更加广泛。
图片的OCR识别容易受到距离、光线、字符大小、字符清晰度等的影响,导致在自然环境下图片字符的识别率较低,进而影响查询的有效进行,因此现有的字、词典软件中图片文字识别输入方式多采用拍照输入的方式,即输入拍下的照片,指定识别的区域,再进行指定区域内字符的识别,由于拍下的照片像素较大,识别的指定位置又非常精确,使得字符识别的准确率较高,但是这样也会导致识别时间较长,识别效率较低,而且当不能识别字符或照片不清晰时则需要重新拍照输入,整个流程比较繁琐,人机交互差。
中国专利号为200911000056.2的发明专利公开了一种使用照相机自动调整字符大小的装置和方法,通过对包含字符的图像按自动缩放比二次拍摄,获得可识别的字符图像;这种方法虽然通过快照OCR的方式实现图片字符的大小调整,但是它需要使用大量计算来检测当前图像中文字的区域和大小,并在假设摄像位置尽量不变的情况下自动调整焦距和缩放。这在手持的摄像头情况下用户体验不好,因为手持摄像头时因为摄像头不断晃动,很多图像可能因处于晃动中而是模糊状态,识别里面的文字区域大小和识别文字内容一样的困难并且耗时。而且摄像头因为不断晃动导致焦距和图像内容一直在变,基于自动识别文字大小的计算可能因跟不上实际焦距的晃动和识别内容的晃动而变得无效。除了识别速度慢、识别场景要求高之外,还会受到摄像头焦距的限制,由于摄像头的缩放都有一定极限,达到一定极限就难以聚焦,当摄像头自动聚焦缩放到一定极限后仍不能识别获取字符时,就无法进行摄像头取词查询。
如何突破摄像头缩放聚焦的局限,实现快速的字符查询以及如何更好的提高人机交互性,也是本发明所需解决的技术问题。
本发明人利用预览OCR进行字符的识别并应用于字符的数据信息查询,本发明人前期开发的产品,在预览窗口内字符取字框较小,字体过大的情况下,会出现取字框不能包含目标字符的问题,字体过小的情况下,会出现取字框包含多个字符,不能精确定位目标字符的问题,另外手的晃动还可能导致图像焦距模糊和图像不断晃动,从而较难瞄准图像中的目标待查字符,整个选取的过程繁琐,大大降低摄像头查字的用户体验。
在摄像头取字查询的过程中,如何排除其他字符的干扰,实现精确选字查询,也是本发明面对的问题。
为此本发明人尝试进行了多种改进,其中之一即对摄像头拍摄的预览图像数据流进行取帧并在取得的一帧数据源基础上进行以目标识别区域为中心的快速图像缩放控制和关键位置图像显示,以方便用户在晃动的摄像头图像上快速瞄准目标待查字符和快速聚焦目标区域,该方法可快捷的获得便于识别的字符图像以及准确高效的进行目标字符识别,获得了较好的预期效果。
发明内容
为了解决现有技术中存在的不足及问题,本发明提供了一种预览图像手动缩放进行字符查询的方法及装置,通过对预览图像进行手动聚焦缩放,可以更方便的对目标待查字符精准选取,获得更清晰的待识别字符图像,字符的识别率和识别速度大幅提高,实现单手控制的聚焦缩放和快速精准选取,人机交互更加快捷,用户查字体验更好。
本发明一方面,提供一种预览图像手动缩放进行字符查询的方法,其包括:
10:选取照相机预览窗口中的目标字符;或
将照相机预览窗口中的目标字符置于取字框内;
20:如果目标字符较小或较大,则手动触控对预览图像进行聚焦缩放;
30:利用光学字符识别模块识别选取的目标字符;
40:将识别后的目标字符进行查询操作并将查询结果显示在当前窗口中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明数数字出版科技有限公司,未经上海明数数字出版科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710600705.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:影像获取装置及其渐进式对焦方法
- 下一篇:拍摄画面处理方法、装置和终端
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序