[发明专利]基于非完整识别的词语快速输入方法在审
| 申请号: | 201210284415.7 | 申请日: | 2012-08-10 |
| 公开(公告)号: | CN102937837A | 公开(公告)日: | 2013-02-20 |
| 发明(设计)人: | 周红全 | 申请(专利权)人: | 上海驿创信息技术有限公司 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023;G06K9/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200434 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 完整 识别 词语 快速 输入 方法 | ||
1.单字非完整手写识别:联机手写识别时,每个字不需要完整的写完就能进行识别,并按照预测识别概率给出预测识别候选字。其特征在于,包括以下几个步骤:
1)系统事先指定需要手写识别的汉字字符范围,单字手写识别过程在此范围内进行。
2)为每个汉字建立整字模板和一系列派生模板,派生模板是指依据汉字的构成和书写过程而建立的子字模板,可以由汉字的部首或任意一部分构成,子字模板本质上可以是整字模板的其中任意部分。
3)每个子字模板根据其相对于整字模板的完整度计算权重。
4)用户通过鼠标或触屏等方式书写时,检测得到一系列用户书写轨迹,但整个书写轨迹不一定需要构成一个完整的汉字,即用户可只书写汉字的任意一部分。
5)将检测得到的一系列书写轨迹与指定的汉字字符范围中每个汉字的每一个模板按照整字识别算法进行匹配,匹配后得到的概率乘以对应子字模板的权重,可得到用户书写轨迹相对于该字每一个模板的匹配概率。取该字全部模板匹配概率的最大值作为用户书写轨迹与该字匹配时的最终匹配概率,即预测识别概率。
6)把汉字字符范围中每个汉字的预测识别概率按照大小排序,当多个汉字的预测识别概率相等时,这部分汉字按照它们的使用频率排序。
7)按照排序后的预测识别概率给出相应的预测识别候选字系列。
2.词语非完整手写识别:联机手写识别输入词语时,词语中每个字不需要完整的写完就能识别,根据单字非完整手写识别,按照预测候选字概率组合搜索词语库中的词语进行匹配,匹配结果按照概率排序。其特征在于,包括以下几个步骤:
1)系统事先指定需要识别的词语库范围,词语识别过程在此范围中进行。
2)用户书写词语中的每一个汉字时,均可按照权利要求书1中的4)进行,对于含有多个汉字的词语,其中某些字也可以完全不书写任何轨迹。
3)对于词语库中的每一个词语,如权利要求书1中的5),把用户书写词语时每个汉字对应的轨迹与词语库中每个词语相应位置的汉字进行识别匹配,则每一个词语中有对应书写轨迹的每个汉字均可得到一个预测识别概率,词语中没有相对应书写轨迹的汉字概率为0。
4)对于词语库中的每一个词语,把由步骤3)得到的每个汉字的概率以求和方式或者其它方式进行计算,则每个词语均得到一个组合概率,即用户书写轨迹与这个词语匹配后的预测识别概率。
5)把词语库中的每一个词语按照其预测识别概率大小进行排序,当多个词语的预测识别概率相等时,这部分词语按照它们的使用频率排序。
6)按照排序后的预测识别概率给出相应的预测识别候选词语系列。
3.拼音手写联合词语输入:用户在输入词语时,以拼音输入方式给出词语中第一个字或每个字的简拼或完整拼音,再书写词语中第一个字或每个字的部分(或整字)轨迹;首先根据拼音信息得到候选词语,再根据词语非完整手写识别的预测识别概率来对候选词语的排序。
其特征在于,包括以下几个步骤:
1)系统事先指定需要识别的汉字字符和词语库范围,识别过程在此范围中进行。
2)用户输入拼音系列时,在指定的汉字和词语库范围内生成候选字或词系列。
3)如果是单字输入,以候选字系列作为新的汉字字符范围,重复权利要求书1中的步骤。
4)如果是词语输入,以候选词系列作为新的词语库范围,重复权利要求书2中的步骤。
5)将得到的预测识别候选字或词作为最终的候选字或词。
4.词语手写智能联想识别:单字输入确定后,待输入字不需要完整写完,根据单字非完整手写识别结果并结合词语联想功能,智能预测待输入字。其特征在于,包括以下步骤:
1)系统事先指定需要识别的汉字和词语库范围,识别过程在此范围中进行。
2)以任意方式输入一个字后,在词语库中进行联想,得到联想候选词系列。
3)以联想候选词中的第二个字作为汉字字符范围,重复权利要求书1的步骤。
4)把所有联想候选词按照步骤3)得到的单字预测识别结果的概率排序,形成新的联想候选词系列。
5.如权利要求书1-4中所述的方法,其特征在于,每个汉字的模板中均包含整字模板和若干个子字模板。
6.如权利要求书1-4中所述的方法,其特征在于,用户书写一个其想要输入的汉字时,整个书写轨迹可以包含一个或多个笔划轨迹,即用户可以以任意方式书写该字的任意部分。
7.如权利要求书1-4中所述的方法,其特征在于,检测得到的用户书写轨迹将与指定汉字范围的每个汉字进行识别匹配,得到的匹配概率是该字的预测识别概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海驿创信息技术有限公司,未经上海驿创信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210284415.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:扇形空域绘制方法及装置
- 下一篇:一种自动保存用户界面状态的方法





