[发明专利]一种错字字形编辑、编码和输入系统及方法有效
申请号: | 201210165401.3 | 申请日: | 2012-05-25 |
公开(公告)号: | CN102722261A | 公开(公告)日: | 2012-10-10 |
发明(设计)人: | 栗青生;王爱民;杨玉星;郭涛;吴琴霞 | 申请(专利权)人: | 栗青生;王爱民;杨玉星 |
主分类号: | G06F3/023 | 分类号: | G06F3/023;G06F17/30 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 赵慧 |
地址: | 455000 河南省安阳市黄河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 错字 字形 编辑 编码 输入 系统 方法 | ||
技术领域
本发明涉及错字形编辑、打印和制版印刷领域,特别涉及数字化对外汉语教学中常见的错字输入系统及方法,具体为一种错字字形编辑、编码及输入系统及方法。
背景技术
利用计算机进行汉字输入、排版和印刷,是目前办公自动化和印刷领域一件极其平常的事,但是,如果要输入并印刷计算机字库中没有的汉字,用户往往要大费周折,通常的办法有两种:一是利用造字程序制造,二是临时做一个汉字图片来暂时替代。错字属于字库中没有的字,少量的错字可以用上述的方法来进行,但随着我国汉语教学特别是对外汉语教学的发展,外国人学写汉字的人越来越多,由于汉字学习的复杂性,出现了外国人在书写汉字时的错误种类和数量成倍增长,使用字库制造错字和编辑错字图片的方式远远不能适应数字化汉语教学的需要。
为此许多学者开始在错字编辑和识别方面进行研究,并且已经取得了一些成果。比较典型的有内蒙古师范大学李小庆和林民老师的“基于国际标准的错字处理方案”,在该方案中,两位老师。基于Unicode 5.1标准中表意文字变体序列标准(ideographic variation sequences,IVS),设计并实现了。以正字为中心组织和管理错字,使用正字加IVS变体选择符表示错字编码,应用OpenType字体技术进行输入输出错字处理方案。
以上处理错字的方法都是在原有字库的基础上利用标准字库中的空闲区域或不常使用的汉字内码区域来存放错字,这些方法最大的不足是占用了汉字宝贵的编码空间,随着错字规模的扩大,这些空间会很书被用完,例如,Chinese GBK国标码为[AAA1-AFFE],[F8A1-FEFE]和[A140-A7A0],仅这3个段就有4636个,Unicode编码为[E000-F8FF]共6400个。即使每个汉字取一个错字存放也需要6400个,而实际情况,错字的数量远不是一个汉字只有一个错字,因些以上的错字输入和处理方案在处理大批量错字方面还有很多缺陷。
为此,需要找到一种错字输入和编辑的方法,能够开放错字的编辑数量,方便用户输入,更好的服务汉字的出版和印刷,为汉语教学特别是对外汉语教学提供数字化的错字编辑和印刷环境。
发明内容
针对现有技术中存在的不足,本发明提供了一种通过自建错字字形库,并可以进行动态编辑的错字字形编辑、编码和输入系统及方法。
本发明的技术方案是这样实现的:一种错字字形编辑、编码和输入系统,其特征在于,包括用于创建错字字形库的错字字形库编辑模块,用于提取错字字形库中错字字形的特征点的错字特征提取模块,用于对错字的特征点进行编码的错字编码模块,以及用于将编码后的错字输入计算机的错字输入模块。
上述错字字形编辑、编码和输入系统,错字字形库编辑模块实时动态编辑用户需要输入的错字以创建错字字形库,对于编辑过的错字,错字字形库编辑模块把错字文字结构的错字特征数据传递给错字特征提取模块;错字特征提取模块分析接收到的错字特征数据,采用错字特征提取算法提取错字特征数据中的特征点信息,并将特征点信息传递给错字编码模块;错字编码模块通过错字动态编码算法将错字特征提取模块中提取的特征点信息进行编码处理,并将编码处理后的错字进行存储;错字输入模块接收用户输入的正确汉字,通过字形检索找到该字对应的错字编码,并将经过错字编码模块编码的错字输入到编辑器中进行制版和印刷。
上述错字字形编辑、编码和输入系统,还包括接收需要调整和编辑的错字信息的错字实时动态编辑模块,错字实时动态编辑模块调用错字字形库编辑模块将文档中的错字实时动态编辑处理,并把错字文字结构的错字特征数据传递给错字特征提取模块。
利用上述错字字形编辑、编码和输入系统的错字字形编辑、编码和输入方法,包括如下步骤:
A.利用错字字形库编辑模块创建错字字形库:错字字形库中存储正确汉字及每个正确汉字所对应的错字;
B.通过错字特征提取模块对错字字形库中错字字形的特征数据提取特征点信息;
C.利用错字编码模块对错字编码:根据错字字形的特征点信息对错字进行编码,创建检索表;
D.通过错字输入模块实现错字字形的输入:根据输入的正确汉字,通过检索表在错字字形库中查找到输入的正确汉字所对应的错字,选择需要的错字字形,即可输入错字字形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于栗青生;王爱民;杨玉星,未经栗青生;王爱民;杨玉星许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210165401.3/2.html,转载请声明来源钻瓜专利网。