[发明专利]一种文字识别方法及装置有效
| 申请号: | 201410156083.3 | 申请日: | 2014-04-17 |
| 公开(公告)号: | CN105095826B | 公开(公告)日: | 2019-10-01 |
| 发明(设计)人: | 张宇;杜志军 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20 |
| 代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 杨移 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 文字 识别 方法 装置 | ||
1.一种文字识别方法,其特征在于,包括:
根据已识别的文字确定对应的特殊应用场景和特殊校正模型;
根据待识别文字的特征,确定所述待识别文字的备选文字;
针对每个备选文字,根据已识别的所述待识别文字的前一个文字,采用特殊校正模型确定所述待识别文字是该备选文字的特殊后验概率;其中,所述特殊校正模型是预先根据统计的出现在特殊应用场景中的词汇的词频得到的;
根据每个备选文字的特殊后验概率,对所述待识别文字进行识别。
2.如权利要求1所述的方法,其特征在于,根据每个备选文字的特殊后验概率,对所述待识别文字进行识别之前,所述方法还包括:
针对每个备选文字,根据已识别的所述待识别文字的前一个文字,采用通用校正模型确定所述待识别文字是该备选文字的通用后验概率;
根据每个备选文字的特殊后验概率,对所述待识别文字进行识别,具体包括:
根据每个备选文字的通用后验概率和特殊后验概率,对所述待识别文字进行识别。
3.如权利要求2所述的方法,其特征在于,根据每个备选文字的通用后验概率和特殊后验概率,对所述待识别文字进行识别,具体包括:
针对每个备选文字,根据位于所述待识别文字之前的所有已识别文字所构成的子句的可信度权值、将所述待识别文字识别为该备选文字的置信度、该备选文字的通用后验概率和特殊后验概率,确定在所述待识别文字是该备选文字的条件下,位于所述待识别文字之前的所有已识别文字与该备选文字所构成的子句的可信度权值;
将确定的可信度权值最大的备选文字确定为识别出的所述待识别文字。
4.如权利要求3所述的方法,其特征在于,采用公式确定在所述待识别文字是该备选文字的条件下,位于所述待识别文字之前的所有已识别文字与该备选文字所构成的子句的可信度权值Q(t,k);
其中,t表示所述待识别文字是第t个文字;
t-1表示所述待识别文字的前一个文字是第t-1个文字;
k表示确定的所述待识别文字的第k个备选文字;
j表示已识别出的所述待识别文字的前一个文字为:在识别所述前一个文字时,针对所述前一个文字确定出的第j个备选文字;
P1(ct,k)表示当所述待识别文字是第一个文字时,所述待识别文字是第k个备选文字的通用后验概率;
P2(ct,k)表示当所述待识别文字是第一个文字时,所述待识别文字是第k个备选文字的特殊后验概率;
CF(ct,k)表示将所述待识别文字识别为第k个备选文字的置信度;
Q(t-1,j)表示位于所述待识别文字之前的所有已识别文字所构成的子句的可信度权值;
P1(ct,k|ct-1,j)表示当所述待识别文字不是第一个文字时,所述待识别文字是第k个备选文字的通用后验概率;
P2(ct,k|ct-1,j)表示当所述待识别文字不是第一个文字时,所述待识别文字是第k个备选文字的特殊后验概率。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
当已识别出的文字中存在预设的易混字时,确定所述易混字所在的易混字集合,其中,所述易混字集合中每个易混字的文字类型各不相同;
在各文字类型中,选择满足指定条件的文字类型,其中,针对待定文字类型,如果已识别出的各文字中属于该待定文字类型的文字的数量最多,则该待定文字类型为满足指定条件的文字类型;
将所述易混字调整为所述易混字集合中属于所述满足指定条件的文字类型的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410156083.3/1.html,转载请声明来源钻瓜专利网。





