[发明专利]一种文字识别方法、装置及电子设备有效
申请号: | 201610942164.5 | 申请日: | 2016-10-25 |
公开(公告)号: | CN107977659B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 陈苏 | 申请(专利权)人: | 北京搜狗科技发展有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/68 |
代理公司: | 北京华沛德权律师事务所 11302 | 代理人: | 马苗苗 |
地址: | 100084 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 识别 方法 装置 电子设备 | ||
本发明公开了一种文字识别方法、装置及电子设备,该方法包括:对待识别图像进行预处理,获得仅包含文字的目标图像;提取所述目标图像中的文字;针对提取到的每个文字,获得所述每个文字的连通特征;针对所述每个文字,分别提取构成文字的所有像素点中各行的横坐标及纵坐标的最大和最小的像素点,构成所述每个文字的轮廓特征;根据已建立的字模库,以及所述每个文字的所述连通特征和所述轮廓特征,对所述每个文字进行识别。通过上述技术方案,实现了对不规则文字的准确识别,提高了文字识别能力。
技术领域
本发明涉及软件技术领域,特别涉及一种文字识别方法、装置及电子设备。
背景技术
目前,国内主流文字识别软件主要应用于影印类书籍、基本证件照片识别,主要能够识别宋体、楷体、黑体等一些常用字体,很少用于识别不规则的文字,例如验证码、变形文字图片等,且对拉长、缩短或旋转等的汉字识别能力弱。
国外一些主流的文字自动识别软件,如GSA Captcha Breaker,对英文识别效果要高于国内OCR(Optical Character Recognition,光学字符识别)识别软件,但不支持汉字的识别。因为汉字是一种特殊的模式,其特点是字数多,字形复杂,有的字形十分相似,印刷体汉字又有多种字体(仿宋、宋、黑、楷书等)和多种大小不同的字号,再加上变形、拉长、旋转等操作,更难以被准确识别。
可见,如何提供一种能够准确识别不规则文字已经成了当前亟需解决的技术问题。
发明内容
本发明实施例提供一种文字识别方法、装置及电子设备,用于实现对不规则的文字进行准确识别,提高文字识别能力。
本申请实施例提供一种文字识别方法,包括以下步骤:
对待识别图像进行预处理,获得仅包含文字的目标图像;
提取所述目标图像中的文字;
针对提取到的每个文字,获得所述每个文字的连通特征;
针对所述每个文字,分别提取构成文字的所有像素点中各行横坐标及各列纵坐标的最大和最小的像素点,构成所述每个文字的轮廓特征;
根据已建立的字模库,以及所述每个文字的所述连通特征和所述轮廓特征,对所述每个文字进行识别。
可选的,根据所述每个文字的所述连通特征和所述轮廓特征,在已建立的字模库中,对所述每个文字进行识别。
可选的,所述提取所述目标图像中的文字,包括:
根据所述目标图像中文字的分隔条件,获得所述每个文字所在的第一区域;
在所述第一区域中,获得表征文字的像素点横坐标及纵坐标的最大和最小的顶点坐标点
提取由所述顶点坐标点构成的矩形区域中的所有像素点组成的图像作为所述第一区域中的文字。
可选的,所述根据所述目标图像中文字的分隔条件,获得所述每个文字所在的第一区域,包括:
获得所述目标图像中至少一列全为背景像素点的分割线;
根据所述目标图像左右两侧背景的背景宽度,获得所述目标图像中所有文字所在的第二区域;
在所述第二区域中,根据文字最小宽度以及所述分割线,获得所述每个文字所在的第一区域。
可选的,所述针对提取到的每个文字,获得所述每个文字的连通特征,包括:
获得所述每个文字中各表征文字的连续像素点构成的连通部分,及所述连通部分的属性信息;
将所有的所述连通部分和所述连通部分的属性信息作为所述连通特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610942164.5/2.html,转载请声明来源钻瓜专利网。