[发明专利]一种基于拼音的藏文智能输入法有效
| 申请号: | 201410142863.2 | 申请日: | 2014-04-10 |
| 公开(公告)号: | CN103984420B | 公开(公告)日: | 2017-11-14 |
| 发明(设计)人: | 程卫军;洛桑旦增 | 申请(专利权)人: | 中央民族大学 |
| 主分类号: | G06F3/023 | 分类号: | G06F3/023 |
| 代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 余长江 |
| 地址: | 100081 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 拼音 藏文 智能 输入法 | ||
技术领域
本发明涉及一种输入法,尤其涉及一种基于拼音的藏文智能输入法。
背景技术
藏文自创制以来,无论作为民族文化传承的主要载体,还是现在作为藏区传播科技知识的主要工具,甚至作为信息化社会中一个民族的主要标示符,其独特的人类文化价值和在广大藏区发挥的巨大作用是不可估量的。
藏文跨入信息时代数十年来,在计算机藏文信息处理的各方面得到了长足的发展,也取得了不少的成绩,从藏文的打字录入到藏文排版处理、藏文电子邮件的收发、藏文网站建设、藏文应用软件的开发、藏文课件的制作等等。
藏文是拼音文字,具有横向书写性结构同时还具有纵向书写性结构,它的词组或句子是由一个个音节(或称为字)组成的,一个音节对应一个音,一个音节又有若干个藏文字母组成,粗看起来它和英文很相似,如但是对于一个藏文音节来说,它又要从一个基字开始,由上加字、下加字、前加字、后加字叠加组合而成,因而又有了平面字的特点。藏文的音节的结构是以一个字母为核心,核心的字母叫“基字”,其余的字母在此基础上前后附加和上下叠写,组合成一个完整的字表结构,且每个字母的称谓都根据加在基字的部位而得名。如图1所示。
藏文30个辅音字母均可作基字,但是,可做前、后、上、下加字的字母在文法中都是有规定的,而且数量有限。
藏文读音也是基字辅音为中心的,一个音节只有一个元音(元音a可省略),因此一个音节对应一个音,在藏文拼读时,从最左边的辅音字母开始,其顺序是1)前加字,2)上加字,3)基字,4)下加字,5)元音,6)后加字,7)再后加字。
藏文的书写是以音节为单位,从左到右横写,音节之间用小点隔开,如音节的书写顺序与拼读的顺序一致,大部分输入法也是按照此顺序来输入藏文编码的,但是具体输入理论较为复杂,而且有很大的弊端,因为当书写上加字或下加字时某些特殊的字母需变形,所以藏文在国际编码Unicode中一共定义了211个字符,其中包含普通字符、叠加字符、数字符号、天文历算符号等。再利用Opentype字库标记特征,将这些普通字符与叠加字符组合而成,此功能是字体库本身具备的而非输入法,输入法将根据用户的输入形成字符编码,字体库根据此编码通过字库标记特征从而显示藏文音节。
目前,藏文的录入速度与汉文等其它部分语言的录入速度相比仍具有明显差距,尤其在移动终端上,主要原因缺乏高效的、智能的输入法。在现有输入法当中,仅有少数具有词组输入功能,微软Himalaya输入法等国外藏文输入法都不支持词组或智能输入法,而国内的具有词组输入的班智达输入法采用了基字加后加字的词组编码方案,但具有不自然,难记难用且重码多,用户可随意输入字符任意组合,违反藏文的文法等缺点。因此急需开发一种易用、自然、通用性强且重码低的智能输入方案,以提高藏文的录入速度。
发明内容
为了克服现有技术中存在的技术问题,本发明的目的在于提供一种基于拼音搜索的藏文输入法,根据藏文的文字结构、发音特征及拼写方法,本发明将一些字母作为拼音字符来标识特定音节,不考虑音节的叠加过程表示,实现拼音输入,因此本发明提出的拼音输入法就是以它为基础的。具体为利用好藏文的拼读规则,将藏文音节与对应关系的拼音存放到字库中,通过输入法形成拼音编码,再根据输入法引擎返回目标字集。
因此本发明具有重码低,易于实现,易于建立和扩充词库等特点,且符合藏文书写的自然思维方式,容易理解及使用。
本发明目的通过以下技术方案得以实现:
一种基于拼音的藏文智能输入法,其步骤为:
1)将每一藏文辅音字母和每一藏文元音字母分别设置一键位码;
2)根据藏文音节的拼写顺序对每一音节设置一对应的拼音编码,并将其保存到一输入法字库中;
3)建立一拼音编码与键位码的关系树;
4)基于所述输入法字库建立一输入法引擎,所述输入法引擎根据输入的键位码遍历所述关系树,得到对应的拼音编码;然后根据该拼音编码查询所述输入法字库,返回对应的藏文。
进一步的,所述对每一音节设置一对应的拼音的方法为:对于单字符藏文音节,设置其拼音为单字符藏文音节本身;对于无上下叠加的多字符藏文音节,设置其拼音为多字符藏文音节本身;对于有上下叠加的多字符藏文音节,设置其拼音为单字符藏文音节本身。
进一步的,同一拼音编码对应一个或多个音节。
进一步的,所述输入法引擎根据拼音编码查找匹配的拼音,将所有与这个拼音匹配或以这个拼音为开头的藏文显示到输入法的候选字区域中,并按词频顺序排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中央民族大学,未经中央民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410142863.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种镀锌铁线缠绕器
- 下一篇:烟气复合除尘除雾装置





