[发明专利]一种基于图像的汉语文字识别方法在审
申请号: | 201811354843.6 | 申请日: | 2018-11-14 |
公开(公告)号: | CN109508712A | 公开(公告)日: | 2019-03-22 |
发明(设计)人: | 唐芳贵 | 申请(专利权)人: | 衡阳师范学院 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/32;G06K9/00;G06K9/68 |
代理公司: | 长沙新裕知识产权代理有限公司 43210 | 代理人: | 周跃仁 |
地址: | 421002 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 校正 文字识别 文字载体 语句结构 字符信息 匹配 扫描 计算机应用技术 汉语 图像文字识别 文字位置信息 图像预处理 语义 标准轮廓 文字位置 板面 导出 逐行 数据库 转换 记录 分析 | ||
本发明涉及计算机应用技术领域,具体涉及一种基于图像的汉语文字识别方法。所述方法包括:步骤一、获取待识别的图像;步骤二、对已获取的图像预处理;步骤三、对图像中的文字载体进行逐行识别,扫描完该行字符后再依次扫描下一行字符,获取所述文字载体的轮廓;步骤四、将所述载体的轮廓与数据库中标准轮廓进行匹配,将匹配后的字符信息转换为该字符信息对应的文字;步骤五、记录所述文字位置信息;步骤六、根据各文字位置进行板面分析得到语句结构分布;步骤七、对所述语句结构分布进行校正,得到校正后的识别结果,以确定图像的语义;步骤八、导出校正后的识别结果。提高了图像文字识别的精度。
技术领域
本发明涉及计算机应用技术领域,具体涉及一种基于图像的汉语文字识别方法。
背景技术
随着移动互联网的迅速发展,基于移动终端摄像头采集到的图像的应用越来越广泛,其中图像识别技术将图像中的文字进行识别,转换为文本文字,从而减轻了用户输入对应文字信息的负担,方便用户存储、编辑对应的文字信息,但是图像文字识别技术是一个十分复杂的技术问题,特别是在图像内容复杂的情况下,文字识别精度往往无法满足用户的需求。
发明内容
为了解决上述问题,本发明提供了一种基于图像的汉语文字识别方法。
具体技术方案为:一种基于图像的汉语文字识别方法,所述方法包括:
步骤一、获取待识别的图像;
步骤二、对已获取的图像预处理:对倾斜图像进行校正,阀值化处理获得前景信息以及背景信息单一的图像;
步骤三、对图像中的文字载体进行逐行识别,扫描完该行字符后再依次扫描下一行字符,获取所述文字载体的轮廓;
步骤四、将所述载体的轮廓与数据库中标准轮廓进行匹配,将匹配后的字符信息转换为该字符信息对应的文字;
步骤五、记录所述文字位置信息;
步骤六、根据各文字位置进行板面分析得到语句结构分布;
步骤七、对所述语句结构分布进行校正,得到校正后的识别结果,以确定图像的语义;
步骤八、导出校正后的识别结果。
优选的,所述步骤二中对倾斜图像进行校正的步骤包括:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度,得到直线角度并旋转图像角度。
优选的,所述步骤三中对图像中的文字载体进行逐行识别,扫描完该行字符后再依次扫描下一行字符,获取所述文字载体的轮廓具体包括:按照图像中的文字载体进行逐行识别,若首行像素的扫描结果为空,则继续扫下一行像素,直至扫描到该行像素中有待识别的内容,然后扫描完该行字符后再逐行扫描下行字符像素,直至获取所有的字符。
优选的,所述步骤四数据库为常规字体,包括宋体、仿宋、华文楷体、华文仿宋、微软雅黑、楷体、新宋体、方正舒体、方正姚体、黑体、华文彩云、华文行楷、华文隶书、华文宋体、幼圆。
优选的,步骤四所述将载体的轮廓与数据库中标准轮廓进行匹配,将匹配后的字符信息转换为该字符信息对应的文字,具体包括:将扫描后的字符信息与数据库中标准轮廓进行匹配,若匹配后的字符信息与多种文字相对应,则将匹配后的字符信息转换为字符长度最长的文字。
优选的,步骤五所述记录文字位置信息具体包括:采用Faster-RCNN对所述多个区域中的文字区域进行检测,以获取所述文字位置信息。
优选的,所述步骤六具体包括:将文字行中各字块的识别结果与词语进行匹配,得到结构成语的识别结果;然后利用构成成语的识别结果以及未构成词语的识别结果按照字块顺序进行组合得到语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于衡阳师范学院,未经衡阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811354843.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种第三方接口的配置方法及装置
- 下一篇:图片获取方法、装置、终端和存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序