[发明专利]一种传统蒙古文与西里尔蒙古文的相互转换方法在审
申请号: | 201711498245.1 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108334502A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 萨仁都拉嘎;白蒙;呼和;木仁;巴图赛恒 | 申请(专利权)人: | 内蒙古蒙科立蒙古文化股份有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 010000 内蒙古自治区呼和*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蒙古文 转换 词汇 集合 词缀 词干 数据库 文本 测试实验 网络条件 循环操作 词缀表 转换率 遍历 语句 存储 检索 查询 分割 合并 成功 | ||
一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于:选取需要转换的文本,分割转换文本中的词汇,存入转换集合中;第二步判断转换集合中的词汇为传统蒙古文或者是西里尔蒙古文;第三步根据判断查询传统蒙古文与西里尔蒙古文数据库,将存入转换集合的被转换词汇在传统蒙古文与西里尔蒙古文数据库中进行遍历循环操作;第四步将获得的转换后的词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的词干及词缀,将词干和词缀进行合并,获得被转换词汇的转换词,并存储到转换后的集合中,完成传统蒙古文与西里尔蒙古文的相互转换。从而达到高效正确的转换率,经过测试实验,在网络条件良好的情况下,进行传统蒙古文与西里尔蒙古文的相互转换,100个词汇组合成的语句,转换成功仅需要1.2秒至3秒的等待时间,转换快速准确。
技术领域
本发明涉及语言的转换方法,尤指一种少数民族语言的转换方法,具体的指一种传统蒙古文与西里尔蒙古文的相互转换的方法。
背景技术
蒙古文字是用来书写蒙古语的文字,主要包括中华人民共和国境内蒙古族通用的回鹘(古维吾尔)式蒙古文和蒙古国主要使用的西里尔蒙古文。蒙古文在蒙古族的文化发展上起着重要作用,通过它保存了丰富的文化遗产。用蒙古文写成的历史文献、文学作品、语文工具书以及译成蒙古文的汉文典籍、佛教经典,据有关方面统计近1500种。尤其在中华人民共和国建立以来,用蒙古文出版了大量政治、经济、文化、科学、教育、文学等方面的图书,其中包括中外名著的译本,并发行了多种报刊。现行蒙古文与回鹘式蒙古文相比,有如下特点:一些字母的形状有了改进,更便于连写;一些字母的写法发生分化,分别表示不同的读音;补充了拼写借词时使用的一些字母;拼写规则趋于严密,一个词不再分写成两段。到了比较晚近的阶段,有些词和附加成分的规范写法改成接近现代口语的形式,并增加了新式标点符号。
外蒙古独立后,受苏联影响,采用的以西里尔字母拼写的文字。现蒙古国使用的文字在1940年代用西里尔字母拼写,除了原来的字母以外,还加入了θθ和YY两个字母来表示俄语中所没有的元音。1946年起,蒙古人民共和国的蒙古族全部转用了新蒙古文,用来记录蒙古国通用的喀尔喀方言。传统蒙古文有几个音使用相同的字母,如7个元音只用5个字母,o和u、和ü都分别使用同一个字母表示;t和d也没有完全区别开。一些字母连写后容易混淆。部分写法必须死记,给学习、认读造成不便。西里尔字母文字能够清楚地区别这些音,基本做到了“怎么说就怎么写”,且字母形体区别较大,各个分开,不易误读。从左向右横写,方便排版和科技文献。但同时也没有了传统蒙古文书写迅速、兼顾各地方言等优势。
随着中国和蒙古国两国之间的文化、教育和经济的交流与合作不断深入,两国之间的文字转换工作也变的极其重要。传统蒙古文到西里尔蒙古文转换、西里尔蒙古文到传统蒙古文转换的工作会给两国蒙古族同胞的交流带来更多的便利,并且对蒙古族的科学、文化和教育发展具有重要的意义。随着我国“互联网+”以及人工智能的全球化的快速进行中,传统蒙古文和西里尔蒙古文的信息化需要的关键技术就是传统蒙古文和西里尔蒙古文在互联网上进行相互转换。因此本发明人在此基础上进行研究发明。传统蒙古文和西里尔蒙古文之间有不可分割的联系,但二者之间有一定的区别:(1)传统蒙古文有35个字母,其中包含8个元音字母和27个辅音字母。西里尔蒙古文也有35个字母,其中包含13个元音字母,20个辅音字母,硬化字母和软化字母各一个。(2)西里尔蒙古文字母区分大小写,而传统蒙古文字母不区分大小写。西里尔蒙古文字母的大写用法跟英语相似。传统蒙古文字母不区分大小写,并且每个字母在词中变化有很多,单词中字母在上、中、下位置不同将导致写法也不相同。(3)西里尔蒙古文和传统蒙古文的书写方向不同。西里尔蒙古文采用的是从左到右的书序,从上到下的行序,而传统蒙古文采用从上到下的书序,从左到右的行序。(4)西里尔蒙古文和传统蒙古文的书面语和口语的差别程度并不相同。西里尔蒙古文中的书面语和口语基本保持一致,口语中怎么发音就基本上怎么拼写,而传统蒙古文的书面语与口语不是一一对应的,书面语转口语时会出现元音和辅音的脱落、增加和变换等现象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古蒙科立蒙古文化股份有限公司,未经内蒙古蒙科立蒙古文化股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711498245.1/2.html,转载请声明来源钻瓜专利网。