[发明专利]一种文字识别方法、装置及电子设备有效

申请号：	201610942164.5	申请日：	2016-10-25
公开（公告）号：	CN107977659B	公开（公告）日：	2021-03-16
发明（设计）人：	陈苏	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G06K9/32	分类号：	G06K9/32;G06K9/68
代理公司：	北京华沛德权律师事务所 11302	代理人：	马苗苗
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文字识别方法装置电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种文字识别方法、装置及电子设备，该方法包括：对待识别图像进行预处理，获得仅包含文字的目标图像；提取所述目标图像中的文字；针对提取到的每个文字，获得所述每个文字的连通特征；针对所述每个文字，分别提取构成文字的所有像素点中各行的横坐标及纵坐标的最大和最小的像素点，构成所述每个文字的轮廓特征；根据已建立的字模库，以及所述每个文字的所述连通特征和所述轮廓特征，对所述每个文字进行识别。通过上述技术方案，实现了对不规则文字的准确识别，提高了文字识别能力。

技术领域

本发明涉及软件技术领域，特别涉及一种文字识别方法、装置及电子设备。

背景技术

目前，国内主流文字识别软件主要应用于影印类书籍、基本证件照片识别，主要能够识别宋体、楷体、黑体等一些常用字体，很少用于识别不规则的文字，例如验证码、变形文字图片等，且对拉长、缩短或旋转等的汉字识别能力弱。

国外一些主流的文字自动识别软件，如GSA Captcha Breaker，对英文识别效果要高于国内OCR(Optical Character Recognition，光学字符识别)识别软件，但不支持汉字的识别。因为汉字是一种特殊的模式，其特点是字数多，字形复杂，有的字形十分相似，印刷体汉字又有多种字体(仿宋、宋、黑、楷书等)和多种大小不同的字号，再加上变形、拉长、旋转等操作，更难以被准确识别。

可见，如何提供一种能够准确识别不规则文字已经成了当前亟需解决的技术问题。

发明内容

本发明实施例提供一种文字识别方法、装置及电子设备，用于实现对不规则的文字进行准确识别，提高文字识别能力。

本申请实施例提供一种文字识别方法，包括以下步骤：

对待识别图像进行预处理，获得仅包含文字的目标图像；

提取所述目标图像中的文字；

针对提取到的每个文字，获得所述每个文字的连通特征；

针对所述每个文字，分别提取构成文字的所有像素点中各行横坐标及各列纵坐标的最大和最小的像素点，构成所述每个文字的轮廓特征；

根据已建立的字模库，以及所述每个文字的所述连通特征和所述轮廓特征，对所述每个文字进行识别。

可选的，根据所述每个文字的所述连通特征和所述轮廓特征，在已建立的字模库中，对所述每个文字进行识别。

可选的，所述提取所述目标图像中的文字，包括：

根据所述目标图像中文字的分隔条件，获得所述每个文字所在的第一区域；