[发明专利]一种字体识别方法、装置和存储介质在审
申请号: | 202110227168.6 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112784932A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 陈景伟 | 申请(专利权)人: | 北京百炼智能科技有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/62;G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 吴晓霞;栗若木 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字体 识别 方法 装置 存储 介质 | ||
本文公开了一种字体识别方法、装置和存储介质。其中,所述方法包括,根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;对于每一个待进行字体识别的文本区域图片分别进行如下操作:根据所述文本区域图片和预设的字体库,生成至少一个字体图片;根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。
技术领域
本公开涉及但不限于一种计算机图像处理、人工智能等技术,尤其涉及一种字体识别方法、装置和存储介质。
背景技术
目前字体识别的技术方案主要有两种:机器学习和图像处理。机器学习主要是通过搜集大量不同字体样本,不断训练迭代优化模型的方法,达到字体识别的目的,因为字体种类很多,如果要使模型识别的泛化能力更强,必须提供大量不同种类的样本数据。而图像处理方法是通过分析计算字体图片本身的特征,进行特征匹配的方法达到识别的目的;这种方法不需要事先准备大量不同字体样本数据,但需要根据需求提供待识别字体库明细。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本公开实施例提供一种字体识别方法、装置和存储介质,不依赖于大量各类字体的样本,提升了字体识别的准确性和执行效率。
本公开实施例提供一种字体识别方法,包括,
根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;
对于每一个待进行字体识别的文本区域图片分别进行如下操作:
根据所述文本区域图片和预设的字体库,生成至少一个字体图片;
根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;
分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;
选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。
一些示例性的实施例中,所述根据所述文本区域图片和预设的字体库,生成至少一个字体图片,包括:
根据所述文本区域图片进行光学字符识别OCR,确定文本内容;
根据所述文本区域图片的宽度和高度,确定字号;
根据所述文本区域图片的宽度、高度和所述字号,按照所述预设的字体库中的字体列表,针对所述文本内容生成至少一个字体图片;其中,每一个字体图片分别是所述文本内容采用一种字体时的图片。
一些示例性的实施例中,所述根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片,包括:
对所述文本图片进行文本区域检测,根据检测结果将所述文本图片划分为至少一个文本区域图片;
对所述至少一个文本区域图片进行过滤,将过滤后保留下来的文本区域图片各自确定为一个待进行字体识别的文本区域图片;
其中,所述对所述至少一个文本区域图片进行过滤包括:
对所述至少一个文本区域图片进行颜色种类过滤;
或者,对所述至少一个文本区域图片进行高度过滤;
或者,对所述至少一个文本区域图片进行颜色种类过滤和高度过滤。
一些示例性的实施例中,对所述至少一个文本区域图片进行颜色种类过滤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百炼智能科技有限公司,未经北京百炼智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110227168.6/2.html,转载请声明来源钻瓜专利网。