[发明专利]一种传统蒙古文与西里尔蒙古文的相互转换方法在审
申请号: | 201711498245.1 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108334502A | 公开(公告)日: | 2018-07-27 |
发明(设计)人: | 萨仁都拉嘎;白蒙;呼和;木仁;巴图赛恒 | 申请(专利权)人: | 内蒙古蒙科立蒙古文化股份有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06F17/27;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 010000 内蒙古自治区呼和*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 蒙古文 转换 词汇 集合 词缀 词干 数据库 文本 测试实验 网络条件 循环操作 词缀表 转换率 遍历 语句 存储 检索 查询 分割 合并 成功 | ||
1.一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于:选取需要转换的文本,分割转换文本中的词汇,存入转换集合中;第二步判断转换集合中的词汇为传统蒙古文或者是西里尔蒙古文;第三步根据判断查询传统蒙古文与西里尔蒙古文数据库,将存入转换集合的被转换词汇在传统蒙古文或西里尔蒙古文数据库中进行遍历循环操作;第四步将获得的转换后的词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的词干及词缀,将词干和词缀进行合并,获得被转换词汇的转换词,并存储到转换后的集合中,输出显示,完成传统蒙古文与西里尔蒙古文的相互转换。
2.根据权利要求1所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于传统蒙古文及西里尔蒙古文词汇的组合方式都为词干+词缀或单一词干形式组合而成;传统蒙古文构成是由多个字节字母从上至下组合而成,区别于非汉字其他文字。
3.根据权利要求1所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于传统蒙古文与西里尔蒙古文数据库为三级数据库,分别为一级数据库目录表;二级数据表词汇表和三级数据表词缀表。
4.根据权利要求1——3任意一项所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于第三步判断若被转换文本为西里尔蒙古文,则循环遍历被转换集合,转换集合中的每一个词汇的首字母,查询数据库一级数据表目录表,查询结果包含词汇所属二级数据表词汇表的名称、词汇词性和属性信息;据已获得的查询结果中的二级数据表词汇表,查询词汇表中西里尔蒙古文词干是否被查询词汇所包含,若包含则与传统蒙古文转换数据库中三级数据表建立联系,列出该词干的传统蒙古文及该词干对应的三级数据表词缀表,同时将获取到的西里尔蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词汇的西里尔词缀;分别为获得的西里尔词缀在对应的词缀表中进行检索,从而最终获得被转换词汇的传统蒙古文词干及传统蒙古文的词缀,将词干和词缀进行合并,获得被转换词汇的传统蒙古文转换词,并存储到传统蒙古文转换集合中。
5.根据权利要求1——3任意一项所述的一种传统蒙古文与西里尔蒙古文的相互转换方法,其特征在于第三步若被转换文字为传统蒙古文,程序遍历操作被转换集合,根据被转换集合中的词汇的首字节,查询数据库一级数据表目录表,在查询结果中将获得该词汇的二级数据表词汇表名称、词汇词性和属性等信息。依据传统蒙古文构成规则,传统蒙古文是由多个字节字母从上至下组合而成,区别于非汉字其他文字,在获得的二级数据表词汇表中进行查询操作,查询词汇表中所属的传统蒙古文词干字段是否被转换词汇所包含,若包含则与西里尔蒙古文转换数据库中的三级数据表建立联系,列出该词干的西里尔蒙古文及该词干对应的三级数据表词缀表,同时将获取到的传统蒙古文词干和被查询转换的词汇进行文字截取,获得被转换词的传统蒙古文词缀;将获得的传统蒙古文词缀在对应的词缀表中进行检索与对比操作,最终查询出符合转换条件的西里尔蒙古文词缀;将最终符合条件的西里尔蒙古文词干和词缀进行合并,得到被转换的传统蒙古文的西里尔蒙古文,并将得到的转换文本存储到西里尔蒙古文转换集合中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古蒙科立蒙古文化股份有限公司,未经内蒙古蒙科立蒙古文化股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711498245.1/1.html,转载请声明来源钻瓜专利网。