[发明专利]一种文字识别方法和装置在审
申请号: | 201710257788.8 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107169496A | 公开(公告)日: | 2017-09-15 |
发明(设计)人: | 魏晓明 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文字 识别 方法 装置 | ||
技术领域
本发明涉及文字识别领域,特别是涉及一种文字识别方法,一种文字识别装置,一种计算机设备,以及,一种计算机可读存储介质。
背景技术
在文字识别领域,尤其是对包含一整串文字的文字图像的识别,通常需要将整串文字切分为多个单独的文字,针对各个文字分别进行识别。
在切分的时候,通常是按照由多个切分点组成的切分路径对图像进行切分,切分出的区域中可能包含有由多个文字所合并而成的文字,针对合并而成的文字进行识别,即可得到识别结果。
然而,目前的识别方法中,对文字的切分或合并存在较高的错误率,这样会影响到最终识别结果的准确性。即,目前的文字识别方式存在识别准确率较低的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种文字识别方法、一种文字识别装置、一种计算机设备以及一种计算机可读存储介质。
依据本发明的一个方面,提供了一种文字识别方法,所述方法包括:
利用多种切分方式分别切分文字图像得到多种图像切分结果,各图像切分结果所包括的多个切分区域分别包括至少一个待识别对象;
根据所述切分区域中的待识别对象统计各图像切分结果的综合权重值,其中,所述综合权重值包括所述图像切分结果中各切分区域的文字特征匹配度和形状特征匹配度的统计值;
根据各图像切分结果的综合权重值筛选最优图像切分结果;
采用所述最优图像切分结果中各切分区域对应的目标文字作为识别结果。
可选地,所述根据所述切分区域中的待识别对象统计各图像切分结果的综合权重值的步骤包括:
根据所述图像切分结果中各切分区域的待识别对象与识别所述切分区域中的待识别对象得到的目标文字的文字特征匹配度,以及,各切分区域的待识别对象与所述目标文字对应的预设形状的形状特征匹配度,计算所述图像切分结果的综合权重值。
可选地,所述利用多种切分方式分别切分文字图像得到多种图像切分结果的步骤包括:
在所述文字图像上标记多个候选切分点;
按照选取的不同候选切分点,分别形成多个候选切分点集合;
按照各候选切分点集合,分别切分所述文字图像得到多个图像切分结果。
可选地,所述文字图像包括多个待切分对象,所述在所述文字图像上标记多个候选切分点包括如下至少一种:
在所述文字图像距离均等的多个位置上标记多个候选切分点;或者
查找所述文字图像上各个相邻但不连通的目标待切分对象,并在各目标待切分对象之间的位置上标记多个候选切分点;或者
将所述文字图像上各待切分对象投影在某方向坐标轴上得到多个投影坐标点,根据某方向坐标轴上不存在投影坐标点的坐标在所述文字图像上对应的位置标记多个候选切分点。
可选地,所述利用多种切分方式分别切分文字图像得到多种图像切分结果的步骤包括:
按照所述待识别对象在所述文字图像中的排列顺序,依次对各个待识别对象采用多个具有不同标记范围的标记窗口进行标记;
识别不同标记范围的标记窗口标记的待识别对象所对应的目标文字;
根据所述标记窗口标记的待识别对象与对应的目标文字,筛选出各个待识别对象的最优标记窗口;
按照各个待识别对象的最优标记窗口,切分所述文字图像得到所述图像切分结果。
可选地,包括:
提取所述切分区域中的待识别对象的特征向量;
在预设的文字匹配表中查找匹配于所述特征向量的文字作为所述目标文字;
计算所述切分区域中的待识别对象与所述目标文字的特征向量的余弦值,得到所述切分区域的文字特征匹配度。
可选地,包括:
查找与所述目标文字所属的文字类别对应的预设形状;
计算所述切分区域中的待识别对象与所述预设形状的宽高比的余弦值,得到所述切分区域的形状特征匹配度。
可选地,所述根据所述图像切分结果中各切分区域的待识别对象与识别所述切分区域中的待识别对象得到的目标文字的文字特征匹配度,以及,各切分区域的待识别对象与所述目标文字对应的预设形状的形状特征匹配度,计算所述图像切分结果的综合权重值的步骤包括:
针对同一图像切分结果,计算多个切分区域的文字特征匹配度的平均值和形状特征匹配度的平均值,分别作为所述图像切分结果的文字特征匹配度均值和形状特征匹配度均值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710257788.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可歪头朝阳的遮阳伞
- 下一篇:一种小学生用旅行式书包