[发明专利]一种汉字输入过程中的汉语拼音串处理方法及其系统无效
| 申请号: | 201010134541.5 | 申请日: | 2010-03-25 |
| 公开(公告)号: | CN102200839A | 公开(公告)日: | 2011-09-28 |
| 发明(设计)人: | 薛永刚;陈培军;秦吉胜;侯磊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
| 地址: | 英属开曼群岛大开曼*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 汉字输入 过程 中的 汉语拼音 处理 方法 及其 系统 | ||
1.一种汉字输入过程中的汉语拼音串处理方法,其特征在于,包括如下步骤:
对接收到的汉语拼音串进行切分,分别将所述汉语拼音串中的声母和韵母作为切分子串得到切分子串序列;
对所述切分子串序列中的切分子串进行扩展,并根据扩展结果生成扩展子串序列集合;
按照音节组成特征对所述扩展子串序列集合中每个扩展子串序列进行音节抽取,得到对应的音节序列;
对各音节序列中的音节进行合法性验证,并根据验证结果删除包含有非法音节的音节序列。
2.如权利要求1所述的方法,其特征在于,分别将所述汉语拼音串中的声母和韵母作为切分子串,包括:
如果相邻的至少两个声母字母具备组合为多字母声母的条件,则将该相邻的至少两个声母字母组合并作为一个切分子串;
如果相邻的至少两个韵母具备组合为合法的韵母组合的条件,则将该相邻的至少两个韵母组合并作为一个切分子串。
3.如权利要求1所述的方法,其特征在于,对接收到的汉语拼音串进行切分,还包括:
如果所述汉语拼音串中存在声母后未跟随韵母的声母,则将该声母作为一个切分子串。
4.如权利要求1所述的方法,其特征在于,对接收到的汉语拼音串进行切分,还包括:
如果元音字母与其后的多个字母具备顺序组合得到韵母的条件,则取该元音字母与其后的多个拼音字母组合得到的韵母长度最长的字母串作为一个切分子串。
5.如权利要求1所述的方法,其特征在于,对所述切分子串序列中的切分子串进行扩展,包括:
如果切分子串为单字母声母切分子串且该单字母声母具备变换为双字母声母的条件,则将该切分子串中的单字母声母扩展为双字母声母得到扩展子串;
如果切分子串为双字母声母切分子串且该双字母声母具备变换为单字母声母的条件,则将该切分子串中的双字母声母扩展为单字母声母得到扩展子串。
6.如权利要求5所述的方法,其特征在于,如果切分子串自身为声母子串或韵母子串,则扩展生成的扩展子串序列包括其自身。
7.如权利要求5所述的方法,其特征在于,对所述切分子串序列中的切分子串进行扩展,还包括:
如果相邻的切分子串都为声母切分子串,则分别在该相邻的声母切分子串后增加具备与各声母切分子串组合条件的韵母子串,得到与各声母切分子串对应的至少一个扩展子串。
8.如权利要求1所述的方法,其特征在于,对所述切分子串序列中的切分子串进行扩展,包括:
如果切分子串包括多个韵母组合,则将该多个韵母作为一个扩展子串;
如果切分子串包括以n结尾的鼻韵母且该鼻韵母具备增加g以变换为以g结尾的鼻韵母的条件,则将该以n结尾的鼻韵母扩展为以g结尾的鼻韵母并作为一个扩展子串;
如果切分子串包括以g结尾的鼻韵母且该鼻韵母具备删除g以变换为以n结尾的鼻韵母的条件,则将该以g结尾的鼻韵母扩展为以n结尾的鼻韵母并作为一个扩展子串。
9.如权利要求8所述的方法,其特征在于,对所述切分子串序列中的切分子串进行扩展,还包括:
如果切分子串包括由多字母组成的韵母且该韵母具备分割为零声母韵母和声母的条件,则将该切分子串扩展为包括零声母韵母和声母的扩展子串;
如果切分子串包括由多字母组成的韵母且该韵母具备分割为韵母和零声母韵母的条件,则将该切分子串扩展为包括韵母和零声母韵母的扩展子串。
10.如权利要求1所述的方法,其特征在于,对接收到的汉语拼音串进行切分,分别将所述汉语拼音串中的声母和韵母作为切分子串得到切分子串序列,包括:
遍历接收到的汉语拼音串,将遍历到的拼音字母或字母组合与预先按照设定的切分规则配置的切分规则表中所包含的拼音字母或字母组合进行匹配,如果在该规则表中匹配到相应的字母或字母组合,则将遍历到的字母或字母组合作为所述汉语拼音串的一个切分子串;
将所述汉语拼音串的切分子串按照遍历顺序组合,得到所述汉语拼音串的切分子串序列。
11.如权利要求1所述的方法,其特征在于,对所述切分子串序列中的切分子串进行扩展,包括:
对于切分子串序列中的每一个切分子串,通过查询按照设定的扩展规则配置的扩展规则表,以查找与每一个切分子串对应的扩展子串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010134541.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:可就座的立体花卉种植设施
- 下一篇:一种水稻首脱式收获机





