[发明专利]字符识别方法、装置、存储介质及计算机设备有效

专利信息
申请号: 201910282238.0 申请日: 2019-04-09
公开(公告)号: CN110163203B 公开(公告)日: 2021-08-24
发明(设计)人: 贺三元 申请(专利权)人: 浙江口碑网络技术有限公司
主分类号: G06K9/32 分类号: G06K9/32;G06K9/34
代理公司: 北京中强智尚知识产权代理有限公司 11448 代理人: 黄耀威
地址: 310012 浙江省杭州市西*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字符 识别 方法 装置 存储 介质 计算机 设备
【说明书】:

发明公开了一种字符识别方法、装置、存储介质及计算机设备,涉及浏览器技术领域,主要目的在于能够保证准确识别字符的字体大小,从而能够提升字符的字体大小识别的精确度,所述方法包括:对待识别字符的图像进行识别,得到所述图像中字符的字符内容和外切矩形的第一矩形高度;根据所述字符内容、所述第一矩形高度和预设的多个字体,创建所述字符内容在所述多个字体下的多个字体大小的多个字符,并从所述多个字符中选择矩形高度最符合所述第一矩形高度的字符;将最符合所述第一矩形高度的字符对应的创建字体大小确定为所述图像中字符的字体大小。本发明适用于字符的识别。

技术领域

本发明涉及识别技术领域,特别是涉及一种字符识别方法、装置、存储介质及计算机设备。

背景技术

随着信息技术的不断发展,字符识别技术的使用越来越普通。它可以减少或替换繁琐的文字输入。例如,可以对原始文件进行扫描,通过字符识别技术,例如OCR(OpticalCharacter Recognition,光学字符识别),可以识别出该原始文件扫描图像中的字符,然后根据识别出的字符进行后续操作。在某些情况,为了对原始文件还原保真,通常需要识别图像中字符的字体大小,如对线下菜单的识别,需要对线下菜单中的字符还原保真。

目前,由于OCR算法仅能识别图像中字符的外切矩形的高度,通常根据识别的外切矩形的高度确定图像中字符的字体大小,即将识别出的外切矩形的高度对应的字体大小确定为图像中字符的字体大小。然而,在实际上,一个字符的字体大小包括升坡高度、下坡高度和行间距,其中,外切矩形的高度即为升坡高度,所述升坡高度为字符基线与字符所占的最高高度所在线之间的高度,所述下坡高度为字符基线与字符所占的低高度所在线之间的高度,如图1所示,若根据识别的外切矩形的高度确定图像中字符的字体大小,会造成识别字符的字体大小不准确,从而导致字符的字体大小精确度较低。

发明内容

有鉴于此,本发明提供一种字符识别方法、装置、存储介质及计算机设备,主要目的在于通过预设的多个字体创建多个字体大小的多个字符,并将多个字符中矩形高度最符合识别的矩形高度的字符对应的创建字体大小,确定为所述图像中字符的字体大小,能够保证准确识别字符的字体大小,从而能够提升字符的字体大小识别的精确度。

依据本发明第一方面,提供了一种字符识别方法,包括:

对待识别字符的图像进行识别,得到所述图像中字符的字符内容和外切矩形的第一矩形高度;

根据所述字符内容、所述第一矩形高度和预设的多个字体,创建所述字符内容在所述多个字体下的多个字体大小的多个字符,并从所述多个字符中选择矩形高度最符合所述第一矩形高度的字符;

将最符合所述第一矩形高度的字符对应的创建字体大小确定为所述图像中字符的字体大小。

进一步地,所述从所述多个字符中选择矩形高度最符合所述第一矩形高度的字符之后,所述方法还包括:

将最符合所述第一矩形高度的字符对应的创建字体确定为所述图像中字符的字体。

可选地,所述根据所述字符内容、所述第一矩形高度和预设的多个字体,创建所述字符内容在所述多个字体下的多个字体大小的多个字符,包括:

将所述第一矩形高度对应的字体大小确定为所述多个字体下的初始字体大小,并创建所述字符内容在所述初始字体大小下的多个字符;

对所述初始字体大小下的多个字符进行字体大小放大处理,得到所述字符内容在所述多个字体下的多个字体大小的多个字符。

可选地,所述多个字符为矩形高度符合所述第一矩形高度的多个字符,所述对所述初始字体大小下的多个字符进行字体大小放大处理,得到所述字符内容在所述多个字体下的多个字体大小的多个字符,包括:

将所述初始字体大小下的多个字符中矩形高度小于所述第一矩形高度的字符进行字体大小调整处理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江口碑网络技术有限公司,未经浙江口碑网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910282238.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top