[发明专利]一种汉字元拼双音输入方法有效
申请号: | 200710045928.1 | 申请日: | 2007-09-13 |
公开(公告)号: | CN101135938A | 公开(公告)日: | 2008-03-05 |
发明(设计)人: | 王林 | 申请(专利权)人: | 王林 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;H04M1/23 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈亮 |
地址: | 200050上海市延安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 汉字 双音 输入 方法 | ||
技术领域
本发明涉及一种汉字的键盘输入方法,尤其涉及一种将音形结合的汉语拼音编码输入方式的汉字输入方法。
背景技术
中文信息化是建设中国信息社会的核心。能够普遍运用的易用化、标准化、规范化和高效率的中文汉字输入技术,是中文信息化的关键,具有巨大的价值和意义。
在汉语拼音编码键盘输入法领域,现有全拼输入法、简拼输入法、双拼输入法三种。全拼输入法是完全按照汉语拼音方案、新华字典汉语拼音音节字母进行汉字拼音编码输入的方法。只需按照计算机键盘上的英文字母对应输入全部拼音字母即可,会汉语拼音就会输入。当键入一个汉字的正确的拼音字母后,屏幕上会出现一系列同音字作为候选字,从候选字中选择需要的那个字,并按其前面的号码数,此字即可出现在屏幕上。全拼输入法的一大缺点在于码长(本处所说码长的定义为输入一个汉字所需击键数,但不含翻找选择同音字所需键数),按新华字典汉语拼音音节索引基本音节表计算,平均每音节需要3.25键。再用全拼输入法对7.3亿汉字音节语料库进行输入统计,全拼输入法平均每字需要3.06键。再加上翻找选择同音字所需键数,效率很低。
双拼输入法对任何一个汉字音节最多只输入两键。键盘上的一个键既可以定义为汉语拼音的一个完整声母(包括zh、ch、sh也是一键输入),同时也可以定义为一个完整的韵母(包括汉语拼音方案韵母表中的任何一个韵母)。因此,每一个汉字的输入只需键入两键,第一个键输入声母,第二个键输入韵母。双拼输入法的优点在于码长较短,但缺点在于需要对30多个韵母和多字母声母的分布键位进行记忆,且键位布局混乱,无严格规律,随意性大,甚至个别键位对应二个以上的韵母,记忆量过多。图6A和图6B分别示出了微软双拼输入法和搜狗双拼输入法的键位拼音对应关系图。
此外,无论是全拼还是双拼输入法,只要是通过汉语拼音方式输入汉字,就会遇到重码率高的问题。汉字的同音字非常多,这些海量的同音字造成了输入时的重码过多。以新华字典(中国社会科学院语言研究所编著,商务印书馆出版,第10版)为例,bi音:90字;bo音:51字;fu音:85字;ji音:109字;jian音:73字;li音:80字;qi音:74字;shu音:49字;wei音:63字;wu音:58字;xi音:84字;yi音:115字;yu音:99字;zhi音:82字;zhu音:55字等。大量同音字的存在使拼音输入翻页选字不胜其烦,虽可按频率排列字序,但因同音字太多,有时翻页选字的键数大大超过拼音编码输入键数,输入一个字可能需要十几键,输入效率极低。
从另一方面来看,长期使用全拼或双拼拼音法输入,实际上是“选字输入”、“识别输入”而不是“写字输入”,加之现在人们多数情况下用计算机起草文章,手写汉字机会减少,可能造成“提笔忘字”不会书写的问题。
发明内容
本发明的目的在于解决上述问题,提供了一种汉字元拼双音输入方法,使得计算机的汉字输入变得更为高效、规范和易用。
本申请人对总量超过7.3亿个汉字的语料数据库、覆盖率达99.9%的汉字音节进行了统计分析,发现包含ai、an、ang、ao、ei、en、eng、ong、ou这9个多字母元韵母的汉字音节占到总汉字音节的54%,对这9个多字母元韵母进行键盘键位设计可以极大地提高拼音输入效率。
本元拼双音输入法所称元韵母定义为《汉语拼音方案》韵母表左边第一列的12个韵母(a、o、e、ai、ei、ao、ou、an、en、ang、eng、ong)以及最上面第一行的3个韵母(i、u、v),合计15个。其中,单字母元韵母6个:a、o、e、i、u、v;多字母元韵母9个:ai、an、ang、ao、ei、en、eng、ong、ou。元韵母i、u、v可与韵母表第一列的12个元韵母组合构成所有复合韵母。通过对大规模汉语语料库汉字音节进行数理统计分析,含有该9个多字母元韵母的汉字音节占总汉字音节的54%,元拼拼音输入法就是基于对该9个多字母元韵母进行缩键键位设定的拼音输入法。
本输入法按《汉语拼音方案》规定,对于复合韵母iou、uei、uen提供iu、ui、un简写兼容输入。
同时,本发明根据汉字学和汉字六书理论,对汉字进行大规模数理统计分析,发现“同音不同旁,同旁不同音”的现象,亦即,“同音节的字,其部首不同,同部首的字,其音节不同”。如果能结合汉字的语音和字型,则能很大程度上确定一个汉字,这是本发明的理论核心。而元拼拼音将汉字拼音音节输入键数缩短为1-3键,为汉字音节与部首的结合创造了技术条件和可行性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王林,未经王林许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710045928.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种羽毛球发球机
- 下一篇:带保护装置的交流电磁线圈