[发明专利]汉字形声码无效
| 申请号: | 91108178.X | 申请日: | 1991-09-16 |
| 公开(公告)号: | CN1060363A | 公开(公告)日: | 1992-04-15 |
| 发明(设计)人: | 嵇政 | 申请(专利权)人: | 嵇政 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 210037 江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 汉字 形声 | ||
汉字形声码是一种形码,应用于中文信息处理。
目前,汉字编码方案已有600种,但成名的,不过十几种。编码按信息特征分,基本上为音码、形码、音形码三类。音码的缺点是①同音字太多,②8000汉字,通常只识得三、四千字。形码的缺点是①要记字根及其编码,②字根分解规则的模糊性常造成误码,並增加了记忆量,③字码合成时总有些特殊的规定,④要准确掌握字形。音形码则兼有两者的优点与缺点。当前的电脑输入还是形码占优势,而王永民的五笔字型码为其典型代表。
作为形码方案主要由四部分组成:①字根选择及其编码,②字根分解规则,③识别码设计,④字码合成规则。
字根编码方法有三:①区位码,如王码,②象形码,如钱码,③声码,如全息码。显然声码比较优越,容易记忆,反应快。
字根分解方法常见以笔顺为序。它的优点是将平面结构的字形转化为线性结构的笔顺,简单明确。其缺点是将字形分解得较零碎,常不符合文字传统与习惯,因而王码要加个“兼顾直观”的规定。但是“直观”是个模糊概念。王码的五条分解规则各自独立,使人不知道该用那条规则。
识别码的主要功能是抑制重码,王码的末笔、字型交叉识别码是一种很好的识别码。当字根采用按声取码时,对其识别码提出了更高的要求。杜冰蟾的全息码采用末笔画的八种笔型作为识别码,其离散力不足,故未能实现真正的按声编码。
本发明的目的在于全面改进形码的品质,並实现部分的反向识别功能(见码识字),使它成为一种文字码的雏形。
本发明的构思原理与基本结构如下:
汉字是一种拼形文字,拼音化道路走不通,能否走拼形道路。汉字现代化就是汉字符号化,符号汉字就是文字码。它与一般编码不同之处就在于要求反向识别;还有,编码过程中、符号转换中,不允许存在文字学以外的指令手段。一旦,统筹研究汉字编码与汉字简化(减少字根,而不是减少笔画),实现2500常用字的双向识别是可能的。那时,一般文字资料中,每100个字有99个可以双向识别,这种编码就可称之为“文字码”。它不取代汉字,但可辅助汉字,它将从专业走向社会。本发明是设计文字码的一次初步尝试。
本编码采用英文字母键盘,4位等长码,(用于汉字检索或全汉字编码也可用5位等长码)。150~200个正体字根按音(声母)编码,另声母字根采用韵母的一个字母,首字母或韵腹字母。声母21个,Ch、Sh、Zh写成C1、、Z1。取消分隔用声母W、Y,Y改作ü。元音“O”用作功能码。C1、可占用V、W键,Z与Z合用Z键,这样共26键位。字根读音在下列读音中选择:①今音、②古音、③习惯音,④注音符号音,没有现成读音或因避重需要给予拟定读音的,可采用如下方法:①形转意法,②仿形声法,③仿音省法,④仿反切法,⑤形似法。凡当今通用的成字字根,一律采用今音。凡有现成读音的尽量在现成读音中选取。(注:今音是指现代读音。)
本编码创造一种新的字根分解方法。它与通常的以笔顺为序的动态分解法不同,而是直接分解字形的静态分解法。这种分解法所得的字根比较完整,比较符合于文字传统。如束字王码分解为一、口、小,本编码分解为木、口,符合“说文解字”束从口木的观点。它有一条必循准则与五条顺序运用的优先准则。根据这些严密、确定、统一的准则,任一字形均可得到一个唯一的分解结果。必循准则是“笔顺一致性”准则。这规定分解所得的字根其笔顺必须与整字中的笔顺一致,即字根的笔顺在整字中可以被别的字根间断,但不可颠倒。五条优先准则依次为:①最少字根优先,②脱连优先,③最小根值优先,④笔顺连续优先,⑤笔画先分优先。下面给予扼要说明:
最少字根优先是为了取得较少的字根,这样字根字形完整,並利于反向识别。
汉字中的笔画群组成字根或部件,说明这些笔画间存在一定的关系。依其关系的紧密程度可分为三类,(1)相关:几何学上不相连,而文字学上相连,如八、心,(2)相连:笔画接触,(3)相交:笔画相交,有交点。脱连优先的含义是笔画间关系较松散的,相关与相连优先脱开,其特征是交点数不减少。
字根是由一个笔画、二个笔画,或多于二笔画组成,用“根值”来表示字根笔画的繁简程度。规定二笔以上的复笔字根其根值为1,一个笔画的单笔字根,若其笔型为“折”时,根值为0·8,其余四种笔型时,根值为0·6。最小根值优先准则规定了在同样字根数,同样是脱连(或折交)的情况下,选取根值较小的一种。
静态分解法规定字根的笔顺在整字中可以被别的字根间断,在先行的优先准则相同的条件下,字根笔顺未被间断的分解结果应该优先。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嵇政,未经嵇政许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/91108178.X/2.html,转载请声明来源钻瓜专利网。





