[发明专利]字体识别方法及装置有效

专利信息
申请号: 201510520116.2 申请日: 2015-08-21
公开(公告)号: CN105117740B 公开(公告)日: 2021-06-15
发明(设计)人: 姚聪;周舒畅;周昕宇;印奇 申请(专利权)人: 北京旷视科技有限公司;北京迈格威科技有限公司
主分类号: G06K9/68 分类号: G06K9/68;G06K9/62
代理公司: 北京市磐华律师事务所 11336 代理人: 董巍;高伟
地址: 100190 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字体 识别 方法 装置
【说明书】:

发明提供了一种字体识别方法及装置。所述字体识别方法包括:计算给定文字图像的图像特征;以及基于所计算的图像特征利用训练好的分类模型确定所述给定文字图像中的文字的字体。本发明提供的字体识别方法及装置通过图像特性自动判断给定文字的字体,识别精度高且速度快,此外还免去了人工辨识字体的过程,因此可以极大提高文档处理、艺术设计等过程的效率。

技术领域

本发明涉及图像处理技术领域,具体而言涉及一种字体识别方法及装置。

背景技术

在世界范围内,不同国家、不同地区的人使用不同种类的语言,相应地,文字也各不相同。即使是同一种文字,其字体也可能存在差异(如图1所示)。对于文档图像处理而言,文字字体的变化可能会对文字识别(OCR)的精度产生影响;对于艺术设计而言,不同的字体可以表达不同的设计理念和视觉效果。然而,普通人的字体识别能力是非常有限的,因为目前的常用文字(如中文、英文等)字体繁多,可能高达数千种,且某些字体类别之间的差异微乎其微;即使是专业人士,也必须经过长时间的训练且借助于工具才能具备超群的字体识别能力。因此,基于图像的自动化字体识别在文档图像处理和艺术设计等领域一直是一项重要的技术。

目前,已经存在一些可以直接通过文字图像判断字体的技术。然而,有的方法可以区分中文和英文字符,但是无法识别具体的字体;有的方法可以支持手写字体识别,但是处理的类别非常有限;有的方法仅针对单个汉字,无法处理由多个字符组成的词语或短语;还有的方法采用图像匹配的方式实现字体识别,但是只能识别最常见的几种英文字体,不是针对字体识别的通用解决方案。总之,目前已有的技术和系统在自动化字体识别的精度和适应性等方面仍存在不足之处。

发明内容

针对现有技术的不足,一方面,本发明提供一种字体识别方法,所述字体识别方法包括:计算给定文字图像的图像特征;以及基于所计算的图像特征利用训练好的分类模型确定所述给定文字图像中的文字的字体。

在本发明的一个实施例中,所述分类模型的训练包括:构建文字图像数据库,所述文字图像数据库包括多个文字图像以及每个文字图像相应的标签,所述标签指示相应的文字图像中的文字的字体;计算所述文字图像数据库中的每个文字图像的图像特征;基于所述标签和所计算的每个文字图像的图像特征构建训练集;以及采用随机森林(RandomForest)算法在所述训练集上训练出所述分类模型。

在本发明的一个实施例中,在所述分类模型的训练中:所述计算文字图像数据库中的每个文字图像的图像特征包括:将每个文字图像的高度归一化;在高度归一化后的每个文字图像中采集第一预定数目的不同尺寸的图像块;以及计算每个图像块的图像特征。所述基于所述标签和所计算的每个文字图像的图像特征构建训练集包括:基于每个图像块的标签和所计算的每个图像块的图像特征构建训练集,其中,每个图像块的标签为其所源自的文字图像的标签。

在本发明的一个实施例中,所述计算给定文字图像的图像特征包括:将给定文字图像的高度归一化;在高度归一化后的给定文字图像中采集第二预定数目的不同尺寸的图像块;以及计算每个图像块的图像特征。

示例性地,所述基于所计算的图像特征利用训练好的分类模型确定所述给定文字图像中的文字的字体包括:将所计算的所述第二预定数目的图像块的图像特征分别输入到所述分类模型以得到多个识别结果;以及对所述多个识别结果取平均值作为所述给定文字图像中的文字的字体的最终识别结果。

示例性地,所述第二预定数目为100。

示例性地,所述图像块的高度和宽度相等。

示例性地,所述第一预定数目为50。

在本发明的一个实施例中,计算图像特征包括计算纹理特征和/或形状特征。

示例性地,计算纹理特征包括计算词袋模型(Bag of Words)。

示例性地,计算形状特征包括计算形状上下文(Shape Context)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510520116.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top