[发明专利]一种自然语言句子的语义关系树的构造和比较方法无效
| 申请号: | 200810243607.7 | 申请日: | 2008-12-10 |
| 公开(公告)号: | CN101446944A | 公开(公告)日: | 2009-06-03 |
| 发明(设计)人: | 周国栋;钱培德;朱巧明;李培峰;李军辉;孔芳;王红玲;钱龙华 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G06F17/27 | 分类号: | G06F17/27 |
| 代理公司: | 苏州创元专利商标事务所有限公司 | 代理人: | 陶海锋 |
| 地址: | 215123江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 自然语言 句子 语义 关系 构造 比较 方法 | ||
1.一种自然语言句子的语义关系树的构造方法,其特征在于,对于句子中待建立语义关系树的两个实体,采用下列构造方法:
(1)采用语法分析器产生与句子相对应的句法树;
(2)在句法树中确定两个实体的位置,方法是,依据两个实体的外延范围在句法树中从词汇结点向上寻找,直到发现一个共同结点,即把它确定为实体在句法树中的位置;
(3)在句法树中找出连接两实体的最短路径,分别从两个实体结点出发,向上搜索,并记录经过的路径,直到发现一个最近的共同祖先结点,此时搜索过程中记录下的连接两实体的路径即为最短路径;
(4)在语义关系树中,保留最短路径及其所包含的部分,裁剪掉其余部分,最后得到的最小的语义关系树即为最短路径包含树;
(5)确定句法树中两实体之间存在的结构类别,如果两个实体之间用一个逗号分隔,则为半结构化;如果第二个实体是以介词短语形式修饰第一个实体,则为PP附属结构;如果第二个实体的外延包含了第一个实体,则为嵌入式结构;如果两个实体作为名词短语紧接在一起,则为描述性结构;除此之外的所有结构均视作谓词链接结构;
(6)如果两实体之间的结构类型不是谓词结构,则最短路径包含树即为我们所需要的语义关系树;
如果两实体之间的结构类型是谓词链接结构,则扩展与谓词相关的上下文信息,得到上下文相关的路径包含树,其方法是,首先从最短路径包含树的根节点开始向上移动直到找到一个以谓词为中心词的节点,然后沿着以该谓词为中心词的路径找到该谓词,这样被最短路径包含树和该谓词查找路径所涵盖的子树即我们要找的动态语义关系树。
2.一种自然语言句子的语义关系树的比较方法,其特征在于:对采用权利要求1所述方法获得的两棵语义关系树T1和T2,采用下列方法进行比较:
(1)列出树T1和T2中除叶结点以外的所有结点列表L1和L2;
(2)对于结点列表之间的任意两个结点n1和n2,再连同它们的父结点和祖父结点包括在内,用第(3)、(4)步的方法进行比较,然后将所有的比较结果累加起来,得到最后的结果;
(3)如果以n1和n2为根节点的上下文无关产生式不具有相似性,则返回结果0;否则转下步,所述两个产生式的相似性,是指它们有相同或可替换的头节点;
(4)如果n1和n2是词性标记,则返回结果λ,λ的取值为0~1;否则转下步。
(5)分别找出n1和n2的子结点列表,如果列表不完全一致,则转第6步,否则按照顺序两两配对比较,比较方法同第(3)、(4)步,最后把结果相乘并返回;
(6)找出n1和n2的子结点列表进行模糊匹配时插入删除的可选树节点数#InsDels,和相似树节点的替换树节点数#Subs,然后按照顺序对相似树节点两两配对比较,比较方法同第(3)、(4)步,最后把结果相乘,然后再乘以λ1#InsDelsλ2#Subs,λ1和λ2分别为0.6和0.4,最后结果再返回;
步骤(2)中获得的最后结果值即为两棵语义关系树的相似度。
3.根据权利要求2所述自然语言句子的语义关系树的比较方法,其特征在于:λ的取值为0.4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810243607.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种障碍物分割方法及装置
- 下一篇:存储设备操作的方法、控制器及通信系统





