[发明专利]一种论元抽取方法和系统有效
申请号: | 201310482550.7 | 申请日: | 2013-10-15 |
公开(公告)号: | CN103530281A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 李培峰;朱巧明;周国栋;张玉华;孔芳 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种论元抽取方法和系统,所述方法基于标注信息对训练语料中标注事件实例进行处理,得到训练语料论元模式集合;基于测试语料中事件实例的角色集合对事件实例进行处理,得到测试语料候选论元模式集合;根据论元、触发词语义相似性及依存路径相似性,计算每一候选论元模式和训练语料论元模式集合中各论元模式的模式语义相似度,并基于此获取包含候选论元匹配事件实例中可匹配角色的匹配度信息的论元模式相似度集合;基于论元模式相似度集合,选取与事件实例中的角色匹配度最高且匹配度大于预设阈值的候选论元作为角色的论元。可见本发明基于语义特征对中文事件的论元进行提取,提高了中文事件论元提取的准确率和性能。 | ||
搜索关键词: | 一种 抽取 方法 系统 | ||
【主权项】:
一种论元抽取方法,其特征在于,包括:从训练语料中抽取包含标注信息的标注事件实例,基于所述标注信息对所述标注事件实例进行分析、处理,得到训练语料论元模式集合,其中,所述训练语料论元模式集合包括至少一个训练语料论元模式,所述训练语料论元模式包括由所述标注事件实例的论元、所述标注事件实例的触发词、所述论元到所述触发词的依存路径组合成的三元组;从测试语料中抽取事件实例,获取所述事件实例的角色集合,基于所述角色集合对所述事件实例进行分析、处理,得到测试语料候选论元模式集合,其中,所述测试语料候选论元模式集合包括至少一个候选论元模式,所述候选论元模式包括由所述事件实例的候选论元、所述事件实例的触发词、所述候选论元到所述触发词的依存路径组合成的三元组;根据论元语义相似性、触发词语义相似性以及依存路径相似性,计算所述测试语料候选论元模式中的每一候选论元模式和所述训练语料论元模式集合中的各论元模式的模式语义相似度,得到每一候选论元模式的模式语义相似度集合;基于各个候选论元模式的模式语义相似度集合,获取论元模式相似度集合,所述论元模式相似度集合包括论元模式相似度元素,所述论元模式相似度元素包括候选论元模式中的候选论元匹配所述事件实例中可匹配角色的匹配度信息;基于所述论元模式相似度集合,选取与所述事件实例中的角色匹配度最高且匹配度大于预设阈值的候选论元作为所述角色的论元。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310482550.7/,转载请声明来源钻瓜专利网。
- 上一篇:获取好友名单的方法和装置
- 下一篇:可自动折叠的LED显示屏及其使用方法