[发明专利]一种事件演化知识图谱构建方法、装置、设备及存储介质在审
申请号: | 201910092807.5 | 申请日: | 2019-01-30 |
公开(公告)号: | CN111506734A | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 贺敏;王丽宏;毛乾任;李晨;李熙 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06N5/04;G06F40/247;G06Q50/26 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 孟德栋 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 演化 知识 图谱 构建 方法 装置 设备 存储 介质 | ||
1.一种事件演化知识图谱构建方法,其特征在于,包括:
获取新闻的中文新闻报道;
从所述中文新闻报道中提取对应的事件要素,组合成与所述中文新闻报道对应的中文事件,所述事件要素包括:事件触发词和事件论元;
基于所述事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;
根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述从所述中文新闻报道中提取对应的事件要素,组合成与所述中文新闻报道对应的中文事件,包括:
从所述中文新闻报道的标题中,提取对应的事件要素,组合成与所述中文新闻报道的标题对应的标题级别事件;
从所述中文新闻报道的正文中,查找与所述标题的匹配度最高的候选事件句;
利用从所述候选事件句中提取到的事件要素,对所述标题级别事件中的事件要素进行补充,得到与所述中文新闻报道对应的中文事件。
3.根据权利要求2所述的方法,其特征在于,所述从所述中文新闻报道的标题中,提取对应的事件要素,组合成与所述中文新闻报道的标题对应的标题级别事件,包括:
提取所述标题中的事件触发词;
在预设的事件表示模式中,将与从所述标题中提取到的事件触发词对应的数据项确定为待补充事件表示内容;
从所述标题中,提取与所述待补充事件表示内容中的论元角色对应的事件论元;
将提取到的事件论元补充到所述待补充事件表示内容中,得到所述标题级别事件。
4.根据权利要求2所述的方法,其特征在于,所述利用从所述候选事件句中提取到的事件要素,对所述标题级别事件中的事件要素进行补充,得到与所述中文新闻报道对应的中文事件,包括:
在所述标题级别事件中,将空值所在的数据项确定为待补充数据项;
将与所述待补充数据项对应的论元角色确定为对照项;
将所述候选事件句中的与所述对照项对应的事件论元补充到所述标题级别事件中的所述待补充数据项上,得到所述中文事件。
5.根据权利要求1所述的方法,其特征在于,所述根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱,包括:
将所述先验事理关系和多个所述中文事件输入图形数据库;
生成所述事件演化知识图谱。
6.根据权利要求1至5中任一项所述的方法,其特征在于,还包括:
获取先验事理知识;
根据所述先验事理知识生成所述先验事理关系。
7.一种事件演化知识图谱构建方法,其特征在于,包括:
获取多个事件类型及与每个所述事件类型分别对应的多个子事件类型,及确定与每个所述子事件类型分别对应的初始触发词集合;
扩展每个所述初始触发词集合,分别得到扩展后触发词集合;
获取与每个所述子事件类型分别对应的论元角色;
根据所述事件类型、所述子事件类型、所述扩展后触发词集合和所述论元角色,生成事件表示模式。
8.一种事件演化知识图谱构建装置,其特征在于,包括:获取模块、提取模块、关联模块和构建模块;
所述获取模块,用于获取新闻的中文新闻报道;
所述提取模块,用于从所述中文新闻报道中提取对应的事件要素,组合成与所述中文新闻报道对应的中文事件,所述事件要素包括:事件触发词和事件论元;
所述关联模块,用于基于所述事件要素中的事件论元,针对每个不同新闻,将各自对应的多个不同中文事件进行关联;
所述构建模块,用于根据事件触发词的先验事理关系,构建相关联的多个不同中文事件之间的事件演化知识图谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910092807.5/1.html,转载请声明来源钻瓜专利网。