[发明专利]汉字全息活字库及其操作的实现方法有效

专利信息
申请号: 201110061862.1 申请日: 2011-03-15
公开(公告)号: CN102682022A 公开(公告)日: 2012-09-19
发明(设计)人: 董为群 申请(专利权)人: 高静敏;董为群
主分类号: G06F17/30 分类号: G06F17/30;G06F17/21
代理公司: 北京科龙寰宇知识产权代理有限责任公司 11139 代理人: 孙皓晨;朱世定
地址: 100081 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 汉字 全息 活字 及其 操作 实现 方法
【说明书】:

技术领域

发明涉及中文信息处理领域,具体而言,涉及一种汉字全息活字库及其操作的实现方法。

背景技术

汉字是中华文化的基因,汉字教育是国人基础教育中最重要的部分,汉字是中国走向世界,世界了解中国的桥梁和媒介。然而目前的汉字教育整体水平,比起解放初期的识字运动,并没有质的飞跃。究其根本原因,乃是技术上没有突破,尤其是在利用现代化的信息技术上,几乎没有什么大的作为和突破。对于国内的小学生或是国外的学习者,汉字难认、难记、难写、难查的老大难问题依然没有得到有效解决。

字库是外文字体、中文字体以及相关字符的电子文字字体集合库,被广泛用于计算机、网络及相关电子产品上。目前国内外广泛使用的字库主要有两种格式。一种是由美国Apple和Microsoft公司联合提出的True Type格式,另一种是由Microsoft和Adobe公司提出的Open Type格式。这两种格式均采用数字化的矢量轮廓来描述字形。

从表面上看,中文字库与英文字库没有什么区别,实际上二者差别很大。

首先,英文(以及所有拼音文字)字库里放的是字母,而中文字库里放的是汉字。字母只有26个,而汉字却有成千上万。更大的差别是字母是拼音文字的最小构形单位,而汉字却不是。在文本处理上,英文字库可以与以下功能实现无缝对接:

复制任何一个或多个字符,并可以粘贴;

着色任何一个或多个字符;

粗体、斜体、下划线任何一个或多个字符;

搜寻任何一个或多个字符并显示搜寻结果;

对给定的任何一组字符排序;

对字符组合的合理性和规范性进行检查。

中文字库可以在汉字层面上实现以上功能,问题是中文字符除了汉字,还有部件和笔画。笔画构成了部件,部件构成了汉字,这些构成关系反映了汉字最本质的特点,但是在中文字库中保存的却是整字的矢量轮廓,无法分解成部件和笔画,也没有包含任何汉字构造信息。

可见,由于现有汉字库技术不能对汉字进行拆解,无法为汉字的拆分和组合提供有效技术手段,无法满足国内外汉字学习者的普遍需求。

发明内容

本发明提供一种汉字全息活字库及其操作的实现方法,用以实现汉字在笔画、部件和整字各个层面与英文等价的文本处理功能。

为达到上述目的,本发明提供了一种汉字全息活字库及其操作的实现方法,其特征在于,包括以下步骤:

按照“从整字到部件再到笔画”的汉字拆分原则,将汉字拆分成一组笔画结构数据;将笔画结构数据存入汉字结构库;

从该汉字的矢量图形数据中提取该汉字的整字矢量轮廓数据;将整字矢量轮廓分解成各自独立的笔画矢量轮廓;将笔画矢量轮廓数据存入汉字形体库;重复上述步骤,将包含一定数量汉字的汉字结构库和汉字形体库组合成汉字全息活字库。

较佳的,上述笔画结构数据包括笔顺、笔画类型,以及笔画所属各层部件和/或部首在内的汉字结构和层次信息。

较佳的,将笔画结构数据存入汉字结构库步骤包括:以汉字为单位,对笔画结构数据进行格式化处理,将格式化后的笔画结构数据存入汉字结构库。

较佳的,将整字矢量轮廓分解成各自独立的笔画矢量轮廓步骤包括:将整字矢量轮廓分解成各自独立的笔画矢量轮廓;对汉字的笔画矢量轮廓进行编辑加工处理。

较佳的,将笔画矢量轮廓数据存入形体库步骤包括:以汉字为单位,对笔画矢量轮廓数据进行格式化处理,将格式化后的笔画矢量轮廓数据存入对应字体的汉字形体库。

较佳的,上述汉字全息活字库及其操作的实现方法还包括以下步骤:将汉字全息活字库中的全部或部分汉字组成活字文本;对活字文本进行笔画或部件或整字层面的文本操作;根据用户设定的笔画和/或部件和/或部首和/或整字结构特征,以及笔画和/或部件在汉字中出现的数量和/或位置,对活字文本进行检索;以及将检索的结果进行标注或输出。

较佳的,对活字文本进行笔画或部件或整字层面的文本操作步骤包括:显示汉字文本中的全部或部分汉字的笔画或部件或部首或整字;或着色和/或加粗和/或透明活字文本中的全部或部分汉字的笔画或部件或部首或整字;或复制和/或剪贴和/或移动活字文本中的全部或部分汉字的笔画或部件或部首或整字;或隐藏活字文本中的全部或部分汉字的笔画或部件或部首或整字。

较佳的,上述汉字全息活字库的操作方法还包括以下步骤:根据用户对一个汉字按其书写顺序进行逐笔显示的请求,从汉字形体库中获取汉字的笔顺数据;根据笔顺数据将汉字按书写顺序逐笔显示。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高静敏;董为群,未经高静敏;董为群许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201110061862.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top