[发明专利]一种非特定字体的数字、符号和字母组的识别方法有效
| 申请号: | 202010491654.4 | 申请日: | 2020-06-02 |
| 公开(公告)号: | CN111652130B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 唐志展 | 申请(专利权)人: | 上海语识信息技术有限公司 |
| 主分类号: | G06V30/10 | 分类号: | G06V30/10;G06V30/192;G06F40/279 |
| 代理公司: | 上海政济知识产权代理事务所(普通合伙) 31479 | 代理人: | 辇甲武 |
| 地址: | 200082 上海市杨*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 特定 字体 数字 符号 字母 识别 方法 | ||
1.一种非特定字体的数字、符号和字母组的识别方法,其特征在于,包括以下步骤:
信息采集:对标签样本进行拍照,得到图片信息;
图形矫正:根据所述图片信息的关键信息以及第一预设显示效果规则进行矫正,得到矫正图形,所述关键信息包括线条、每个字符的相对比例,所述第一预设显示效果规则为通过垂直角度采集图片得到的显示效果,矫正的具体图片处理操作通过调用开源模块OpenCV进行;
图形采样:对所述图片信息进行采样消除光线干扰,得到采样图形;
图形预测:根据所述采样图形运算图形趋势,得到预测图形;
模型比对:选定所述预测图形中的每个所述字符,根据所述字符的有效信息得到字体初判类型,并根据所述字体初判类型在已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集,在各所述序列结果集中,各所述比对结果按照置信度从高到低进行排序;
字符比对:分别选取置信度最高所述对比结果的作为个所述字符的返回结果;
模型更新:由所述预测图形生成图片样本,将所述返回结果作为所述图片样本的参数,根据所述图片样本和所述参数更新所述已有样本模型集合,其中,所述模型更新步骤包括:
图片样本保存:根据所述图片样本和所述参数,得到原始图片、文字区域、文字内容,将所述图片样本作为新已有样本模型保存在所述已有样本模型集合中;
加权评分计算:在本次识别过程中,根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功且输出正确结果的识别成功率,对所述图片样本进行加权评分计算,按照由高到低排列;
样本模型调整:根据所述已有样本模型的特征数据与所述图片样本的特征数据匹配成功的累计命中率,将所述累计命中率低的已有样本模型移出已有样本模型集合,放入备用区域;
模型重新生成:将更新后的所述已有样本模型集合生成索引。
2.根据权利要求1所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述模型比对步骤中,还具有以下步骤:
文字选定:定位并选定所述所述预测图形中的每个所述字符;
文字形态预处理:根据各所述字符的所述有效信息进行预处理矫正,得到各矫正后字符;
字体比对:根据所述矫正后文字字符的特征数据在所述已有样本模型中比对,得到每个所述字符的包含与各所述样本模型比对结果的序列结果集。
3.根据权利要求2所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述有效信息包括各所述字符的笔画信息、旋转角度信息,
所述预处理包括根据所述笔画信息判断所述字符是否为反白,如为反白则进行色相矫正,根据所述旋转角度判断各所述字符是否有旋转角度,如有旋转角度则进行旋转矫正。
4.根据权利要求3所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述字体比对步骤前,还具有以下步骤:
字体类型初判:根据各所述矫正后字符的字形状态、笔画粗细状态,以及转折笔画的特征判断得到字体初判类型,去除所述已有样本模型集合中低于预设置信度的所述字体初判类性的样本模型。
5.根据权利要求4所述的非特定字体的数字、符号和字母组的识别方法,其特征在于,所述字符比对步骤中,在进行置信度排序之前,还具有以下步骤:
规则匹配预过滤:将所述序列结果集中的各比对结果与预设字符串内容规则进行匹配,并去除不符合所述预设字符串内容规则的各所述比对结果。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有所述非特定字体的数字、符号和字母组的识别程序,所述非特定字体的数字、符号和字母组的识别程序被处理器执行时实现如权利要求1至5中任意一项所述的识别非特定字体的数字及符号和字母组方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海语识信息技术有限公司,未经上海语识信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010491654.4/1.html,转载请声明来源钻瓜专利网。





