[发明专利]汉字形声码无效

专利信息
申请号: 91108178.X 申请日: 1991-09-16
公开(公告)号: CN1060363A 公开(公告)日: 1992-04-15
发明(设计)人: 嵇政 申请(专利权)人: 嵇政
主分类号: G06F3/023 分类号: G06F3/023
代理公司: 暂无信息 代理人: 暂无信息
地址: 210037 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 汉字 形声
【说明书】:

汉字形声码是一种形码,应用于中文信息处理。

目前,汉字编码方案已有600种,但成名的,不过十几种。编码按信息特征分,基本上为音码、形码、音形码三类。音码的缺点是①同音字太多,②8000汉字,通常只识得三、四千字。形码的缺点是①要记字根及其编码,②字根分解规则的模糊性常造成误码,並增加了记忆量,③字码合成时总有些特殊的规定,④要准确掌握字形。音形码则兼有两者的优点与缺点。当前的电脑输入还是形码占优势,而王永民的五笔字型码为其典型代表。

作为形码方案主要由四部分组成:①字根选择及其编码,②字根分解规则,③识别码设计,④字码合成规则。

字根编码方法有三:①区位码,如王码,②象形码,如钱码,③声码,如全息码。显然声码比较优越,容易记忆,反应快。

字根分解方法常见以笔顺为序。它的优点是将平面结构的字形转化为线性结构的笔顺,简单明确。其缺点是将字形分解得较零碎,常不符合文字传统与习惯,因而王码要加个“兼顾直观”的规定。但是“直观”是个模糊概念。王码的五条分解规则各自独立,使人不知道该用那条规则。

识别码的主要功能是抑制重码,王码的末笔、字型交叉识别码是一种很好的识别码。当字根采用按声取码时,对其识别码提出了更高的要求。杜冰蟾的全息码采用末笔画的八种笔型作为识别码,其离散力不足,故未能实现真正的按声编码。

发明的目的在于全面改进形码的品质,並实现部分的反向识别功能(见码识字),使它成为一种文字码的雏形。

本发明的构思原理与基本结构如下:

汉字是一种拼形文字,拼音化道路走不通,能否走拼形道路。汉字现代化就是汉字符号化,符号汉字就是文字码。它与一般编码不同之处就在于要求反向识别;还有,编码过程中、符号转换中,不允许存在文字学以外的指令手段。一旦,统筹研究汉字编码与汉字简化(减少字根,而不是减少笔画),实现2500常用字的双向识别是可能的。那时,一般文字资料中,每100个字有99个可以双向识别,这种编码就可称之为“文字码”。它不取代汉字,但可辅助汉字,它将从专业走向社会。本发明是设计文字码的一次初步尝试。

本编码采用英文字母键盘,4位等长码,(用于汉字检索或全汉字编码也可用5位等长码)。150~200个正体字根按音(声母)编码,另声母字根采用韵母的一个字母,首字母或韵腹字母。声母21个,Ch、Sh、Zh写成C1、、Z1。取消分隔用声母W、Y,Y改作ü。元音“O”用作功能码。C1、可占用V、W键,Z与Z合用Z键,这样共26键位。字根读音在下列读音中选择:①今音、②古音、③习惯音,④注音符号音,没有现成读音或因避重需要给予拟定读音的,可采用如下方法:①形转意法,②仿形声法,③仿音省法,④仿反切法,⑤形似法。凡当今通用的成字字根,一律采用今音。凡有现成读音的尽量在现成读音中选取。(注:今音是指现代读音。)

本编码创造一种新的字根分解方法。它与通常的以笔顺为序的动态分解法不同,而是直接分解字形的静态分解法。这种分解法所得的字根比较完整,比较符合于文字传统。如束字王码分解为一、口、小,本编码分解为木、口,符合“说文解字”束从口木的观点。它有一条必循准则与五条顺序运用的优先准则。根据这些严密、确定、统一的准则,任一字形均可得到一个唯一的分解结果。必循准则是“笔顺一致性”准则。这规定分解所得的字根其笔顺必须与整字中的笔顺一致,即字根的笔顺在整字中可以被别的字根间断,但不可颠倒。五条优先准则依次为:①最少字根优先,②脱连优先,③最小根值优先,④笔顺连续优先,⑤笔画先分优先。下面给予扼要说明:

最少字根优先是为了取得较少的字根,这样字根字形完整,並利于反向识别。

汉字中的笔画群组成字根或部件,说明这些笔画间存在一定的关系。依其关系的紧密程度可分为三类,(1)相关:几何学上不相连,而文字学上相连,如八、心,(2)相连:笔画接触,(3)相交:笔画相交,有交点。脱连优先的含义是笔画间关系较松散的,相关与相连优先脱开,其特征是交点数不减少。

字根是由一个笔画、二个笔画,或多于二笔画组成,用“根值”来表示字根笔画的繁简程度。规定二笔以上的复笔字根其根值为1,一个笔画的单笔字根,若其笔型为“折”时,根值为0·8,其余四种笔型时,根值为0·6。最小根值优先准则规定了在同样字根数,同样是脱连(或折交)的情况下,选取根值较小的一种。

静态分解法规定字根的笔顺在整字中可以被别的字根间断,在先行的优先准则相同的条件下,字根笔顺未被间断的分解结果应该优先。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于嵇政,未经嵇政许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/91108178.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top