[发明专利]一种文字识别方法在审
| 申请号: | 201611007793.5 | 申请日: | 2016-11-16 |
| 公开(公告)号: | CN106778752A | 公开(公告)日: | 2017-05-31 |
| 发明(设计)人: | 何新霞 | 申请(专利权)人: | 广西大学 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/36;G06K9/38;G06K9/40;G06K9/62;G06K9/46 |
| 代理公司: | 北京天奇智新知识产权代理有限公司11340 | 代理人: | 但玉梅 |
| 地址: | 530004 广西壮族*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文字 识别 方法 | ||
【技术领域】
本发明涉及图像识别技术领域,尤其是涉及一种计算机故障检测系统及方法一种文字识别方法。
【背景技术】
随着数码相机、摄像头、超高速扫描仪等图像获取设备的广泛应用,图像中信息越来越引起人们的关注。其中嵌入在图像中的文字是图像语义内容的一种重要表达方式,能够提供一些人们所需要的重要信息。例如图像中的文字可以是该图像的内容概述,如果能够自动提取和识别图像中的文字,就可以让计算机自动理解图像内容。让计算机像人类一样识别图像中的文字,对于图像和视频的存储、分类、理解及检索等来说具有极其重要的意义,它主要应用在中文信息处理、办公室自动化、及其翻译、人工智能等高技术领域,有着广泛的应用前景和商业价值。目前对图像中的文字一般只是通过简单的图像分割处理来进行识别,无法根据图像中的文字特征来进行自适应调节,导致现有的图像文字识别方法精度较低,无法满足实际应用的需求。
【发明内容】
鉴于以上内容,有必要提供一种计算机故障检测系统及方法一种文字识别方法,目的在于解决现有的图像文字识别方法对文字的识别精度较低的技术问题。
本发明的目的通过以下技术方案实现:
一种文字识别方法,包括以下步骤:
获取待识别图像;
对已获取图像预处理:图像倾斜校正以校正图像和阈值化处理获得前景信息及背景信息单一的图像;
分析处理图像:分析图像的行间纹理特征,获取图像的文字矩阵参数;
分割图像:基于所述文字矩阵参数对图像进行切割,形成若干个子图像,获取图像的文字字块;
识别:对文字字块进行单独处理,获取文字字块的图像特征,并对所述图像特征进行识别;
所述图像校正包括:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度、得到直线角度并旋转图像角度。
进一步的,所述对已获取图像预处理还包括对已识别图像进行图像降噪以提升识别处理的精确度。
进一步的,所述图像降噪处理可以采用小波去噪法、形态学噪声滤除器法、中值滤波器法、自适应维纳滤波器法及均值滤波器法等方法。
进一步的,所述阈值化处理包括固定阈值化方法、自适应阈值化方法、大津法或迭代法。
进一步的,将图像矩阵中图像分为将图像的矩阵坐标中的字体用第一像素值表示,背景用第二像素值表示,统计图像的矩阵坐标中每行第二像素值的个数,获取一数组;统计对若干行高参数,参数取平均值统计,获取字体大小参数。
进一步的,所述识别基于预设的聚类算法对切分后的文字子块进行图像分割处理,获取文字字块中的文字信息,并根据所述文字信息在预置的系统文字库中进行比对,根据比对结构确定图像中的文字。
进一步的,所述分析处理图像还包括对文字字块进行膨胀处理。
进一步的,所述识别步骤包括所提取文字字块进行归一化处理后再进行识别。
本发明有益效果:本发明通过识别图像的矩阵行高纹理特征进行分析,计算出图像文字的矩阵参数,再基于文字相关的矩阵参数估算出文字字体大小参数,然后在对每一个文字快进行分割,并对文字子块进行识别,提高了切分文字子块的准确性,从而提高文字识别的精度。
【具体实施方式】
一种文字识别方法,其特征在于,包括以下步骤:
获取待识别图像;待识别图像可以是任何需要进行文字识别的图像,待识别图像可以来自外部设备。待识别图像可以是原始图像,也可以是对原始图像进行预处理后得到的图像,待识别的图像可以是jpg、bmp、png等图像格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611007793.5/2.html,转载请声明来源钻瓜专利网。





