[发明专利]一种字体识别方法、装置和存储介质在审
申请号: | 202110227168.6 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112784932A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 陈景伟 | 申请(专利权)人: | 北京百炼智能科技有限公司 |
主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/62;G06K9/20;G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 吴晓霞;栗若木 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字体 识别 方法 装置 存储 介质 | ||
1.一种字体识别方法,其特征在于,包括,
根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片;
对于每一个待进行字体识别的文本区域图片分别进行如下操作:
根据所述文本区域图片和预设的字体库,生成至少一个字体图片;
根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点;
分别进行所述文本区域图片和每一个字体图片特征点匹配,并确定对应的特征相似度;
选定特征相似度最大的字体图片所对应的字体为所述文本区域图片的字体。
2.根据权利要求1所述的方法,其特征在于,
所述根据所述文本区域图片和预设的字体库,生成至少一个字体图片,包括:
根据所述文本区域图片进行光学字符识别OCR,确定文本内容;
根据所述文本区域图片的宽度和高度,确定字号;
根据所述文本区域图片的宽度、高度和所述字号,按照所述预设的字体库中的字体列表,针对所述文本内容生成至少一个字体图片;其中,每一个字体图片分别是所述文本内容采用一种字体时的图片。
3.根据权利要求1所述的方法,其特征在于,
所述根据待识别的文本图片,确定至少一个待进行字体识别的文本区域图片,包括:
对所述文本图片进行文本区域检测,根据检测结果将所述文本图片划分为至少一个文本区域图片;
对所述至少一个文本区域图片进行过滤,将过滤后保留下来的文本区域图片各自确定为一个待进行字体识别的文本区域图片;
其中,所述对所述至少一个文本区域图片进行过滤包括:
对所述至少一个文本区域图片进行颜色种类过滤;
或者,对所述至少一个文本区域图片进行高度过滤;
或者,对所述至少一个文本区域图片进行颜色种类过滤和高度过滤。
4.根据权利要求3所述的方法,其特征在于,
对所述至少一个文本区域图片进行颜色种类过滤,包括:
分别确定每一个文本区域图片所包含的颜色种类的数量;
过滤掉文本区域图片所包含的颜色种类的数量小于预设的种类下限数,或大于预设的种类上限数的文本区域图片。
5.根据权利要求3所述的方法,其特征在于,
对所述至少一个文本区域图片进行高度过滤,包括:
计算全部文本区域图片的高度;根据计算得到的高度按照降序对全部文本区域图片进行排序;
在排序后的前H个文本区域图片中,根据预设的保留条件,选择符合所述保留条件的文本区域图片为被保留的文本区域图片;
过滤掉其他未被选择的文本区域图片;
其中,H为大于1的整数;所述保留条件为:文本区域图片的高度大于第一高度,且该文本区域图片的高度与所述待识别的文本图片的高度的比例大于第一高度比例。
6.根据权利要求1-5任一项所述的方法,其特征在于,
所述预设的特征提取算法包括:尺度不变特征转换sift特征提取算法;
所述根据预设的特征提取算法提取所述文本区域图片的特征点,根据所述预设的特征提取算法提取每一个字体图片的特征点,包括:
根据所述sift特征提取算法,提取所述文本区域图片的sift特征;根据所述sift特征提取算法,提取每一个字体图片的sift特征;
所述分别进行所述文本区域图片和每一个字体图片特征点匹配,包括:
对于每一个字体图片,分别执行如下步骤:
采用最小临近距离法,对所述文本区域图片对应的sift特征和该字体图片对应的sift特征进行特征点匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百炼智能科技有限公司,未经北京百炼智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110227168.6/1.html,转载请声明来源钻瓜专利网。