[发明专利]文书辨识的切字错误自动更正方法及装置无效
| 申请号: | 96100537.8 | 申请日: | 1996-04-09 |
| 公开(公告)号: | CN1084503C | 公开(公告)日: | 2002-05-08 |
| 发明(设计)人: | 张照煌 | 申请(专利权)人: | 财团法人工业技术研究院 |
| 主分类号: | G06K9/03 | 分类号: | G06K9/03 |
| 代理公司: | 北京市柳沈律师事务所 | 代理人: | 马莹 |
| 地址: | 台湾省*** | 国省代码: | 台湾;71 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文书 辨识 错误 自动 更正 方法 装置 | ||
1.一种文书辨识的切字错误自动更正方法,可用以根据一竖写文书的候选字矩阵进行切字错误更正,上述候选字矩阵可经由文字辨识后所产生,其特征在于:
利用代表可能发生分割和合并切字错误的字形的一垂直字形结构表,一垂直字元分合装置将上述候选字矩阵扩展为扩充候选字矩阵,再利用一语言模型对上述扩充候选字矩阵组合处理后的字串进行评分处理,选择评分最高的字串,即可将切字错误自动更正。
2.如权利要求1所述的切字错误自动更正方法,上述垂直字形结构表是利用一第一字集中的字形,其垂直分离的各部分仍为一第二字集中的字形,所建立的两者关系表。
3.如权利要求2所述的切字错误自动更正方法,其中上述垂直字形结构表是利用表列结构表示。
4.如权利要求2所述的切字错误自动更正方法,其中上述垂直字形结构表是利用网状结构表示。
5.如权利要求2所述的切字错误自动更正方法,其中上述第一字集可与上述第二字集相同。
6.如权利要求1所述的切字错误自动更正方法,其中上述垂直字元分合装置,利用上述垂直字形结构表,对上述候选字矩阵中机率较高的前L行进行字元合并处理或字元分割处理,产生上述扩充候选字矩阵,L为一正整数且不大于上述候选字矩阵的总行数。
7.如权利要求6所述的切字错误自动更正方法,其中上述字元分割处理、字元合并处理、组合处理、以及评分处理可交错进行,以选择评分最高的字串。
8.如权利要求6所述的切字错误自动更正方法,其中上述字元分割处理、字元合并处理、组合处理、以及评分处理可批次进行,以选择评分最高的字串。
9.一种文书辨识的切字错误自动更正装置,可用以根据一竖写文书的候选字矩阵进行切字错误更正,上述候选字矩阵可经由文字辨识后所产生,其特征在于包括:
一垂直字元分合装置,接收上述候选字矩阵,根据一垂直字形结构表,将其扩展为扩充候选字矩阵,以表示上述候选字矩阵中字元分割及字元合并的情况;以及
一语言模型评分装置,将上述扩充候选字矩阵组合处理后的字串进行评分处理,选择其评分最高的字串,以将切字错误自动更正。
10.一种文书辨识的切字错误自动更正方法,可用以根据一横写文书的候选字矩阵进行切字错误更正,上述候选字矩阵可经由文字辨识后产生,其特征在于:
利用代表可能发生分割和合并切字错误的字形的水平字形结构表,一水平字元分合装置将上述候选字矩阵扩展为扩充候选字矩阵,再利用一语言模型对上述扩充候选字矩阵组合处理后的字串进行评分处理,选择评分最高的字串,即可将切字错误自动更正。
11.如权利要求10所述的切字错误自动更正方法,其中上述水平字形结构表是利用一第一字集中的字形,其水平分离的各部分仍为一第二字集中的字形,所建立的两者关系表。
12.如权利要求11所述的切字错误自动更正方法,其中上述水平字形结构表是利用表列结构表示。
13.如权利要求11所述的切字错误自动更正方法,其中上述水平字形结构表是利用网状结构表示。
14.如权利要求11所述的切字错误自动更正方法,其中上述第一字集可与上述第二字集相同。
15.如权利要求10所述的切字错误自动更正方法,其中上述水平字元分合装置,利用上述水平字形结构表,对上述候选字矩阵中概率较高的前L行进行字元由左至右的合并处理或字元分割处理,产生上述扩充候选字矩阵,L为一正整数且不大于上述候选字矩阵的总行数。
16.如权利要求15所述的切字错误自动更正方法,其中上述字元分割处理、字元合并处理、组合处理、以及评分处理可交错进行,选择评分最高的字串。
17.如权利要求15所述的切字错误自动更正方法,其中上述分割处理、合并处理、组合处理、以及评分处理可批次进行,选择评分最高的字串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于财团法人工业技术研究院,未经财团法人工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/96100537.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:使胶水快速干燥和再生的机器
- 下一篇:相似字识别方法及装置





