[发明专利]德汉翻译系统的词法分析方法无效
| 申请号: | 95108230.2 | 申请日: | 1995-07-26 |
| 公开(公告)号: | CN1063559C | 公开(公告)日: | 2001-03-21 |
| 发明(设计)人: | 陈肇雄 | 申请(专利权)人: | 深圳科智语言信息处理有限公司北京分公司 |
| 主分类号: | G09B19/06 | 分类号: | G09B19/06 |
| 代理公司: | 北京市专利事务所 | 代理人: | 张卫华 |
| 地址: | 100088*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 翻译 系统 词法 分析 方法 | ||
1.一种由逻辑运算部件、存储部件、视频显示部件、输入部件组成的德汉翻译系统的词法分析方法,其特征在于:
(一)建立五个知识库,即:德语基本单词库、规则变化词缀库、不规则变化单词库、缩写词库、不需要再进行词法分析的单词库,其中:
1)德语基本单词库中每个单词有如下的内容:
·原形单词符号
·单词的分类标识符和词义属性标识符
·上下文区分函数
·单词的中文解释
·该单词的词组
并采用多级分类算法建立德语基本单词库的索引文件;
2)规则变化词缀库中每条词缀有如下的内容:
·词缀
·添加字符
·条件
·追加的词形特征属性符号
并按首字符或末字符建立规则变化词缀库的索引文件,采用所有相同首字符的前缀存贮在一起、所有相同末字符的后缀存贮在一起的原则组织存贮;
3)不规则变化单词中每个不规则单词有如下的内容:
·不规则单词
·原形单词
·追加的词形特征属性符号
4)缩写词库以含′为特征,有如下内容:
·缩写词
·该词的完整词形
5)不需要再进行词法分析的德语单词库中的内容只有德语单词的集合;
(二)在接收一个德语单词之后,执行如下词法分析步骤:
1)首先访问德语基本单词库,查询单词是否在库中,如果不在,则执行步骤2);如果在,则记录已有一个德语原形单词,继续执行步骤2);
2)通过访问不需要再进行词法分析的单词库,如果该单词在该库中,则不进行变形单词分析,直接执行步骤7);
3)如果该单词具有缩写形式,即单词中有’号,则查找缩写词库,取出全形词,然后从步骤1)开始执行;
4)访问不规则变化的单词库,如果该单词在该库中,则直接在不规则单词库中取出该单词的原形单词和追加的词形特征属性,并记录下来,然后执行步骤7);
5)按照步骤6)遍访规则变化词缀库中的每一条词缀,遍访结束后执行步骤7);
6)如果根据当前规则的词缀,能将该单词分离成该单词的词干和词缀两部分,则直接取出原形单词并从该词缀规则中取出追加的词形特征属性,并记录下来,然后取出下一条词缀规则按步骤5)继续执行;
7)如果该单词没有原形单词,则转例外出错处理;
8)如果该单词有一个或多个原形单词时,则按照单词的内部存贮结构,逐个生成原形单词的内部存贮结构;
9)如果该单词有多个原形单词时,则按照单词的存贮结构中的属性值链表和词组链表分别合并;
10)词法分析结束。
2.如权利要求1所述的德汉翻译系统的词法分析方法,其特征在于:
访问德语基本单词库的算法是:
1)将单词word转换成一个关键字key;
2)根据二分算法,查询关键字key;
3)若没查到,则失败返回,否则继续执行4);
4)在索引表中找到相同关键字中的第一个关键字;
5)比较当前位置的关键字和要找的关键字key,若不同则失败返回,否则执行6);
6)根据在索引表中当前位置处的文本文件中的位置和字节数,读出单词的信息;
7)比较当前读出的单词与要访问的单词word,若相等则设成功标志及返回单词信息首址,否则继续执行8);
8)索引表中移到下一个关键字位置,转5)执行;
9)结束;
将单词分离成词干和词缀的算法是:
1)为单词作备份,分离前缀取单词首字符,分离后缀取单词末字符;
2)根据首字符或末字符取其词缀区首址;
3)若取完所有的词缀知识,则失败返回;
4)若取完该词缀区所有的词缀知识,均不等则转8),否则继续执行6);
5)取一条词缀知识,比较词缀和单词相应部分字符串,若不等则转8),否则继续执行6);
6)将单词分离成词干和词缀两部分,并根据<添加字符>将单词还原;
7)访问德语基本单词库,若失败,则取单词备份并转8)处理,否则转9)执行;
8)将指针移向下一条词缀知识,转5)执行;
9)检查规则中的<条件>是否满足,如满足则取形变单词的词形特征属性并保留;
10)取下一条词缀,若与当前词缀符号相同,检查该规则中的<条件>是否满足,如满足则取形变单词的新的词形特征属性并追加;
11)成功返回原形单词和词形特征属性,结束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳科智语言信息处理有限公司北京分公司,未经深圳科智语言信息处理有限公司北京分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/95108230.2/1.html,转载请声明来源钻瓜专利网。





