[发明专利]一种基于汉字基础部件的汉字象形码计算机输入法有效
申请号: | 201310047935.0 | 申请日: | 2013-02-06 |
公开(公告)号: | CN103324299B9 | 公开(公告)日: | 2017-01-18 |
发明(设计)人: | 高国鹫 | 申请(专利权)人: | 高国鹫 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 沈阳晨创科技专利代理有限责任公司21001 | 代理人: | 张晨 |
地址: | 117000 辽宁省本溪*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 汉字 基础 部件 象形 计算机 输入法 | ||
技术领域
本发明涉及计算机输入技术,特别提供了一种基于汉字基础部件的汉字象形码计算机输入法。
背景技术
自上世纪八十年代初,汉字输入法编码形成新的一大流派,并一直影响至今,这就是字根类编码汉字输入法,该法理论认为,成千上万的汉字都是由笔画组成字根,再由字根构成汉字的,因此,只要把这些汉字的字根分析出来,再印到键上,一个字有哪几个字根就打哪几个键来组字就可以了,因此这种编码方法受到人们的普遍关注,然而,这种编码自从诞生时起也就与难学联系在了一起,形成所谓“好学的不好用,好用的不好学”这一瓶颈问题,为了寻找到既好学又好用的编码方案,各种汉字拆分方法的字根类编码方案纷至沓来,在这里,汉字的拆分工作在不同地区、不同系统中自发进行,导致汉字拆分呈现五花八门、纷纭交错的结果,如一个“羊”字竞有五种不同的拆分方法,这种状况给汉字教学和汉字信息处理工作带来极大的不便,如果不对字根进行规范,语言文字的规范工作必然要受到冲击,汉字信息的传播和接受无论在速度上,还是在准确度上都会受到严重影响,为此国家部门在上世纪末把社会上流传的各种字根类统筹归并成汉字部件,并颁布《信息处理用GB13000.1字符集汉字部件规范》,于1998年5月1日起实施。
上述汉字基础部件规范的颁布,意味着字根类编码只能依托汉字部件,其它任何随意拆分汉字编码的行为将不能被国家部门认可,难以得到推广和普及,也不能进入中小学校。那么采用汉字部件能否研制出简单易学的编码方案吗?在GB13000.1字符集汉字部件规范中,总共有560个汉字部件,这是根据字源关系确定的,在这里很多独体字就是字源字,而很多字源字又结构比较大,也就是平均笔画比较多,这里称之为大部件,例如“垂、鬼、黑、黄、鹿、鼠、我、象、熏、庸、重”都是汉字大部件,这些大部件在汉字编码中也是不能再拆分的,而不再拆分这些大部件都只用一个字母编码,那么用哪个字母编码,人们怎样记忆,会产生多少重码,这些都成问题,那怎样解决呢?传统形码编码是这样解决的:虽然每个汉字部件都只对应一个字母,也就是一码,但汉字的码长还是可以调整的,例如对于固定为4键的编码方案,如果是部件字或部件数少于4个的字,为增加码长则用笔画码补充,相反对于部件数超过4个的字则舍弃多余部件,例如目前流行最广的五笔字型输入法就是这种模式。采用这种模式编码方案为方便人们使用,一般都有汉字部件在计算机键盘的分布图,印在纸上甚至镌刻在计算机键盘上,目前这种模式编码方案是汉字形码中的主流输入法。
但上述这种模式编码方案并没能解决难学的问题,造成复杂原因有三:一是按字源关系记部件及部件对应的字母键,二是部件的舍弃规则,三是笔画的补充规则。在这里除了用汉字部件属性编码之外,又增加了汉字笔画属性编码,也就增加了学习难度,因此五笔字型输入法经三十多年努力也没能达到普及程度。可以说到目前为止,还没有哪一种形码能够普及,也没能进入中小学校,因此直接采用汉字部件是不能研制出简单易学的编码方案,要突破这一瓶颈还需另辟蹊径。
汉字部件是整字拆分的结果,这里首先分析汉字拆分的作用,如果不拆分汉字,每个汉字都作为独立构件都用1个字母表示,那么数千个汉字分布在26个字键上,虽然每字只按1键,但这种编码几乎是不可能的;如果汉字拆分成2个构件,那么每个汉字就要用2个字母表示,因此从某种意义上说,汉字拆分的直接结果是增加了码长,因为汉字含有相同结构,例如“沙、汉、汝、泽……”可拆分出相同的“氵”等,这时独立构件数会大量减少,重码也减少了,学习也就简单了,因此说码长的增加能够有效减少独立构件数量和减少重码,这使汉字输入方法趋于简单化,当然码长也不能过度增加,如果把汉子都拆分成笔画,那码长过长就适得其反了。
既然汉子拆分的结果能够增加码长,如果不拆分汉子,而是采用从整字平面中直接分析出与字母有关联的笔画结构,然后再与字母对应并用字母表示,从而完成了整字的多字母编码,这同样也增加了码长,在这里,如果直接采用整字编码,因为汉字数量大,需要用很多时间来学习,那怎样来缩短学习时间呢?因为汉字的最小组字单位是汉字部件,汉字部件的总数要远远少于整字,因此,只要在部件平面中直接分析出与字母有关联的笔画结构,然后再与字母对应并用字母表示,那么整字所含部件编码的组合,就是整字的多字母编码。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高国鹫,未经高国鹫许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310047935.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种饮水机的三合一型水箱
- 下一篇:双层隔热杯结构