[发明专利]快三码无重码兼容拼音输入的汉字字词编码方法及键盘无效
| 申请号: | 93107947.0 | 申请日: | 1993-07-07 |
| 公开(公告)号: | CN1082216A | 公开(公告)日: | 1994-02-16 |
| 发明(设计)人: | 卢小林 | 申请(专利权)人: | 卢小林 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 浙江大学专利代理事务所 | 代理人: | 林怀禹 |
| 地址: | 310027 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 快三码无 重码 兼容 拼音输入 汉字 字词 编码 方法 键盘 | ||
本发明涉及将另散信息项目转换为代码形式的装置,具体地说是一种汉字输入方法及所用的键盘。
世界已进入电脑的时代,电脑不仅用来进行数值运算,而且越来越多地用于信息处理,大量的汉字信息要用电脑来处理,首先必须解决如何向电脑输入汉字的问题。迄今为止,国内外提出的汉字输入编码已达四百余种,在常用的电脑汉字输入方法中,其编码方式大致分为按拼音编码方式、整字编码方式和字形分解方式三大类。目前流行的几种输入法大致有代表性的如双拼输入法、王永民的五笔字型输入法等。
五笔字型输入法是一种较好的输入方法,它用130个字根进行拆码,字词兼容,重码少,基本不用选写,每分钟可以输入120~160个汉字,但是它同任何一种编码方法一样,也有许多不尽人意的地方,第一是五笔字型中的交叉识别项,是五笔字型中最影响人们输入速度的硬性规定,它不仅要求人们去判别末笔字画,而且要判断字的结构组合类型,规则极为复杂,极大地加重了人们的思维负担,阻碍了汉字输入速度的进一步提高;第二是部分词根分解过细,不符合人们的习惯;第三是部分键码安排不够合理,大量的击键集中在部分键码上;第四是仍有200多组重码。
本发明的目的是:它采用一种以形码为主的汉字编码方案,其规则码为三位等长码。它是选取组字能力强的160个部首,合理地安排在英文键盘的26个字母键盘上,部分字则采用形码加拼音声母表示,实现了对国标区位6763个汉字的无重编码。
汉字编码方案的设计要求是:直观、简易、快速、没有重码。目前一般采用的四码编码法,没有达到最短、快速的极限。以英文键盘26个小写字母进行三码制编码,可编出汉字为:
三码编码汉字总数=26×26×26=17,576个。
而一般常用汉字在3000个左右,国际标准区所收的汉字为6763个,这些汉字已经基本满足一般专业和行业的文字需要。而且英文26个小写字母对6763个汉字进行编码,每个汉字平均有17576/6763=2.599个码,所以用三码编码能达到无重码或少重编码。对于减少重码或是消灭重码是采用形、音结合的办法,因为形、音结合是汉音本身的特点所决定的。对于形码,它的优点在于,只要能写出汉字,而不必知道其拼音即可输入;对于拼音码,则由于南方及地方音的影响而错误率较大,且对于一些生避汉字,拼音码也无能为力。
本发明具体采用以下的方法:
1.以三码为规则编码,并取二码简码及部分字后追加识别第四码;
2.以形码为主,即大部分字以形码来拆分,据统计,汉字约有78%为三部首汉字,11%为两部首汉字,11%为三部首以上汉字,平均码长为3.1码;
3.部分汉字追加汉字拼音声母进行识别和处理重码。
下面对本发明作进一步的描述。
汉字偏旁部首及键盘设计:汉字偏旁部首选字法,是按基本笔划组成不变的结构划出来的,如“张”字是由“弓”和“长”所组成。汉字的基本部首有很多,对编码来说,部首太少易产生重码,而太多又增加了人们的记忆负担,快三码输入法决定选取160个常用部首作为基本部首,分布于具有西文键盘的计算机上,具体的分布见表所示的汉字部首代码。
汉字拼音的声母:汉字分解成基本字根之后,有时并不能完全唯一地确定一个汉字,因为汉字可以由相同的部首而有不同的字形结构,如左右、上下等来组成不同的汉字。
例如:呗、员
作为文字书写时,人们一目了然,不会有二重性,但作为编码以后,则会产生重码,所以可采用汉字拼音声母,用一个码来确定二义性。但拼音时,由于南方和北方及地方音不同,如z与zh,c与ch,on与ong,an与ang及en与eng等不能区分开来,但对汉字拼音的声母的第一个字母的错误率却是很低的,所以采用汉字声母首字作为编码的识别码。
如:“张”分解为“弓”、“长”、“z”
又解决了由于结构不同而引起的二义性。
如:员分解为“口”、“贝”、“Y”
呗分解为“口”、“贝”、“B”
同时,对于部分三码的重码,采取追加第四码的方法,基本上消除重码。
本发明的汉字字词的具体输入步骤:它包括一个通用的具有西文键盘的计算机、打字机、电传机等的汉字字词输入系统,汉字的单字和词组均用三编码输入,少量字追加第四码以消除重码,同时兼容汉语拼音方案加部首输入。其输入编码规则为:
一、单字
1.成字字根字=字根码+汉字拼音声母
例:口=F〔字根码〕+K〔声母〕
五、交换键(;)的设置:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卢小林,未经卢小林许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/93107947.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分离和克隆有酪氨酸-磷酸酶活性的蛋白质
- 下一篇:中药胨剂及其制备方法





