[发明专利]一种事件演化知识图谱构建方法、装置、设备及存储介质在审
申请号: | 201910092807.5 | 申请日: | 2019-01-30 |
公开(公告)号: | CN111506734A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 贺敏;王丽宏;毛乾任;李晨;李熙 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/04;G06F40/247;G06Q50/26 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孟德栋 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 演化 知识 图谱 构建 方法 装置 设备 存储 介质 | ||
本申请涉及一种事件演化知识图谱构建方法、装置、设备及存储介质,该方法包括:获取新闻的中文新闻报道;从中文新闻报道中提取对应的事件要素,组合成与中文新闻报道对应的中文事件,事件要素包括:事件触发词和事件论元;基于事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。该方法可以缓解现有技术中存在的演化事件的准确度不高的问题,达到了提高演化事件的准确度的技术效果。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种事件演化知识图谱构建方法、装置、设备及存储介质。
背景技术
事件是信息的一种特定的表现形式,事件抽取是自然语言处理中一个重要的研究方向。从自由文本中识别事件的发生并抽取事件的各元素的任务成为文本信息抽取与挖掘的研究难点。ACE2005(Automatic Content Extraction 2005)将该项任务定义为:识别特定类型的事件,并进行相关信息的确定和抽取。在指定的源语言数据中发现特定类型的事件,并且识别出与事件相关的信息填入先验的事件模板中。
目前,事件抽取的研究大多是在ACE英文事件数据集上展开,由于该数据集是英文语料,且只针对特定领域的事件进行抽取,所以,导致事件抽取的领域不易扩展。同时,由于对英文事件的定义较为简单,事件关键要素稀疏,所以无法开展事件抽取的上层研究,上层研究可以包括事件的时序关联、事件的演化与事件的推理分析等。
另外,现有技术大多利用无监督的聚类方法或者基于图计算的概率方法对中文事件进行抽取及对演化事件进行研究,由于现有技术难以准确捕捉中文事件间的联系性,所以现有技术针对中文事件研究得到的演化事件间大多关联性较低,因此,导致演化事件的预测过程无意义,演化事件的准确度不高。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本申请提供了一种事件演化知识图谱构建方法、装置、设备及存储介质。
第一方面,本申请实施例提供了一种事件演化知识图谱构建方法,包括:
获取新闻的中文新闻报道;
从所述中文新闻报道中提取对应的事件要素,组合成与所述中文新闻报道对应的中文事件,所述事件要素包括:事件触发词和事件论元;
基于所述事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;
根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。
可选的,所述从所述中文新闻报道中提取对应的事件要素,组合成与所述中文新闻报道对应的中文事件,包括:
从所述中文新闻报道的标题中,提取对应的事件要素,组合成与所述中文新闻报道的标题对应的标题级别事件;
从所述中文新闻报道的正文中,查找与所述标题的匹配度最高的候选事件句;
利用从所述候选事件句中提取到的事件要素,对所述标题级别事件中的事件要素进行补充,得到与所述中文新闻报道对应的中文事件。
可选的,所述从所述中文新闻报道的标题中,提取对应的事件要素,组合成与所述中文新闻报道的标题对应的标题级别事件,包括:
提取所述标题中的事件触发词;
在预设的事件表示模式中,将与从所述标题中提取到的事件触发词对应的数据项确定为待补充事件表示内容;
从所述标题中,提取与所述待补充事件表示内容中的论元角色对应的事件论元;
将提取到的事件论元补充到所述待补充事件表示内容中,得到所述标题级别事件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910092807.5/2.html,转载请声明来源钻瓜专利网。