[发明专利]一种文字识别方法及用户终端有效
申请号: | 201310193476.7 | 申请日: | 2013-05-22 |
公开(公告)号: | CN103295008B | 公开(公告)日: | 2017-04-05 |
发明(设计)人: | 李昌竹;汪运斌 | 申请(专利权)人: | 华为终端有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙)44285 | 代理人: | 唐华明 |
地址: | 518129 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 识别 方法 用户 终端 | ||
技术领域
本发明涉及通信领域,尤其涉及一种文字识别方法及用户终端。
背景技术
通常,人们在看书或者报纸的时候会把自己感兴趣或者重要的内容标记下了,随着通信的发展,越来越多的人想通过网络将自己感兴趣的内容分享给其他人。
现有的光学字符识别(OCR,Optical Character Recognition)技术,可以将文本内容透过光学仪器,如影像扫描仪、传真机或任何摄影器材,将影像转入计算机、手机等终端,然后对文本内容进行识别进而显示在计算机、手机等终端中。
但是OCR技术只能将整个的图像中的文字内容或者单个词、字进行识别,而不能对用户标记的局部区域内容进行识别,从而降低了用户的体验。
发明内容
本发明提供一种文字识别方法及用户终端,能够实现用户终端只对标记区域内的标记内容进行识别,进而提高了用户体验。
本发明实施例的第一方面提供了文字识别方法,包括:用户终端对文本进行拍照并生成图像,所述文本上带有用户所做的标记;
所述用户终端对所述图像进行识别,并确定所述用户所做的标记在所述图像上对应的标记区域;
所述用户终端对所述标记区域中的标记内容进行光学字符识别。
结合本发明实施例的第一方面,在本发明实施例的第一方面的第一种实施方式中,包括:所述用户所做的标记为直线、或曲线、或椭圆形、或矩形、或圆形。
结合本发明实施例的第一方面,或第一方面的第一种实施方式,在本发明实施例的第一方面的第二种实施方式中,包括:所述用户终端对所述图像进行识别的技术为霍夫变换、或链码技术、或不变距技术、或傅里叶描述子技术、或自回归模式技术。
结合本发明实施例的第一方面,或第一方面的第一种实施方式,在本发明实施例的第一方面的第三种实施方式中,所述用户终端对所述图像进行识别,并确定所述用户所做的标记在所述图像上对应的标记区域的具体步骤包括:所述用户终端通过霍夫变换对所述图像中所述用户所做的标记进行检测及定位;
所述用户终端根据检测及定位的结果确定所述标记区域。
结合本发明实施例的第一方面的第三种实施方式,在本发明实施例的第一方面的第四种实施方式中,所述用户所做的标记为直线时,所述用户终端通过霍夫变换对所述图像中的标记进行检测及定位的具体步骤包括:所述用户终端将直线对应的公式y=ax+b转换成极坐标公式ρ=xcosθ+ysinθ,其中x,y空间中的点对应在极坐标参数空间中的正弦曲线;
所述用户终端选取的x,y坐标系下N个点,将ρ离散化为Nρ个参数空间,将θ离散化为Nθ个参数空间,并依据选取的N个点,算出N个ρ值及与ρ值对应的N个θ值;
所述用户终端通过累加计数的方式在算出N个ρ值及与ρ值对应的N个θ值中获取峰值点(ρ0,θ0);
所述用户终端依据所述峰值点(ρ0,θ0)检测及定位对应x,y坐标系下的直线,所述直线为所述用户所做的标记。
结合本发明实施例的第一方面的第四种实施方式,在本发明实施例的第一方面的第五种实施方式中,所述用户终端根据检测及定位的结果确定所述标记区域的具体步骤包括:所述用户终端依据检测及定位到的所述直线来确定所述直线上方的文字区域为标记区域。
结合本发明实施例的第一方面的第三种实施方式,在本发明实施例的第一方面的第六种实施方式中,当所述用户所做的标记为矩形时,所述用户终端通过霍夫变换对所述图像中的标记进行检测及定位的具体步骤包括:所述用户终端将所述矩形的边对应的公式y=ax+b转换成极坐标公式ρ=xcosθ+ysinθ,所述矩形包括四条边,每条边对应的x,y坐标空间对应一个极坐标参数空间,其中x,y坐标空间中的点对应在极坐标参数空间中的正弦曲线;
所述用户终端在每条边对应的x,y坐标系下分别选取M个点,将ρ离散化为Mρ个参数空间,将θ离散化为Mθ个参数空间,并依据在每条边对应的x,y坐标系下选取的M个点,计算ρ值及与ρ值对应的θ值,所述矩形的一条边对应算出一组M个ρ值及与ρ值对应的M个θ值;
所述用户终端将算出的四组M个ρ值及与ρ值对应的M个θ值作为四个累加数组,通过累加计数的方式在每一个累加数组中获取到一个峰值点,所述一个峰值点对应x,y坐标系中的一条直线,所述四条直线为所述矩形的四条边;
所述用户终端依据矩形的特征从所述累加数组中查找所述矩形四个顶点,其中所述矩形的特征为矩形的相邻两边夹角为90°和矩形的对边等长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为终端有限公司,未经华为终端有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310193476.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:深水悬链线系泊缆的结构设计优化方法
- 下一篇:背向密码输入器