[发明专利]一种基于图像的汉语文字识别方法在审

专利信息
申请号: 201811354843.6 申请日: 2018-11-14
公开(公告)号: CN109508712A 公开(公告)日: 2019-03-22
发明(设计)人: 唐芳贵 申请(专利权)人: 衡阳师范学院
主分类号: G06K9/20 分类号: G06K9/20;G06K9/32;G06K9/00;G06K9/68
代理公司: 长沙新裕知识产权代理有限公司 43210 代理人: 周跃仁
地址: 421002 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 校正 文字识别 文字载体 语句结构 字符信息 匹配 扫描 计算机应用技术 汉语 图像文字识别 文字位置信息 图像预处理 语义 标准轮廓 文字位置 板面 导出 逐行 数据库 转换 记录 分析
【权利要求书】:

1.一种基于图像的汉语文字识别方法,其特征在于,所述方法包括:

步骤一、获取待识别的图像;

步骤二、对已获取的图像预处理:对倾斜图像进行校正,阀值化处理获得前景信息以及背景信息单一的图像;

步骤三、对图像中的文字载体进行逐行识别,扫描完该行字符后再依次扫描下一行字符,获取所述文字载体的轮廓;

步骤四、将所述载体的轮廓与数据库中标准轮廓进行匹配,将匹配后的字符信息转换为该字符信息对应的文字;

步骤五、记录所述文字位置信息;

步骤六、根据各文字位置进行板面分析得到语句结构分布;

步骤七、对所述语句结构分布进行校正,得到校正后的识别结果,以确定图像的语义;

步骤八、导出校正后的识别结果。

2.根据权利要求1所述的一种基于图像的汉语文字识别方法,其特征在于,所述步骤二中对倾斜图像进行校正的步骤包括:先对图像进行膨化处理、检测膨化后图像的边缘、对边缘点进行hough变换找到最长线段的角度,得到直线角度并旋转图像角度。

3.根据权利要求1所述的一种基于图像的汉语文字识别方法,其特征在于,所述步骤三中对图像中的文字载体进行逐行识别,扫描完该行字符后再依次扫描下一行字符,获取所述文字载体的轮廓具体包括:按照图像中的文字载体进行逐行识别,若首行像素的扫描结果为空,则继续扫下一行像素,直至扫描到该行像素中有待识别的内容,然后扫描完该行字符后再逐行扫描下行字符像素,直至获取所有的字符。

4.根据权利要求1所述的一种基于图像的汉语文字识别方法,其特征在于,所述步骤四数据库为常规字体,包括宋体、仿宋、华文楷体、华文仿宋、微软雅黑、楷体、新宋体、方正舒体、方正姚体、黑体、华文彩云、华文行楷、华文隶书、华文宋体、幼圆。

5.根据权利要求4所述的一种基于图像的汉语文字识别方法,其特征在于,步骤四所述将载体的轮廓与数据库中标准轮廓进行匹配,将匹配后的字符信息转换为该字符信息对应的文字,具体包括:将扫描后的字符信息与数据库中标准轮廓进行匹配,若匹配后的字符信息与多种文字相对应,则将匹配后的字符信息转换为字符长度最长的文字。

6.根据权利要求1所述的一种基于图像的汉语文字识别方法,其特征在于,步骤五所述记录文字位置信息具体包括:采用Faster-RCNN对所述多个区域中的文字区域进行检测,以获取所述文字位置信息。

7.根据权利要求1所述的一种基于图像的汉语文字识别方法,其特征在于,所述步骤六具体包括:将文字行中各字块的识别结果与词语进行匹配,得到结构成语的识别结果;然后利用构成成语的识别结果以及未构成词语的识别结果按照字块顺序进行组合得到语句。

8.据权利要求7的一种基于图像的汉语文字识别方法,其特征在于,所述步骤七具体包括:对所述语句结构分布进行校正,得到校正后的识别结果,以确定图像的语义具体为:将语句与数据库进行匹配,依据匹配情况确定各语句的匹配置信度,将匹配置信度高的语句作为校正后的识别结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于衡阳师范学院,未经衡阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811354843.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top