[发明专利]元事件抽取方法、装置、电子设备和存储介质在审
申请号: | 202110282621.3 | 申请日: | 2021-03-16 |
公开(公告)号: | CN112906391A | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 王玉杰;吴飞;刁永祥;方四安;张浩宇;代旭东;柳林;徐承 | 申请(专利权)人: | 合肥讯飞数码科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 程琛 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 抽取 方法 装置 电子设备 存储 介质 | ||
本发明提供一种元事件抽取方法、装置、电子设备和存储介质,其中方法包括:确定待处理文本包含的触发词及其对应的各参数词;抽取触发词对应的每两个参数词在待处理文本中的关系;基于触发词对应的各参数词,以及每两个参数词之间的关系类型,构建触发词的参数关系图;遍历触发词的参数关系图,得到触发词的各元事件。本发明提供的方法、装置、电子设备和存储介质,完成了同一触发词下多元事件的事件拆分,从而实现细粒度的元事件抽取,有助于提高元事件抽取的可靠性和准确性。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种元事件抽取方法、装置、电子设备和存储介质。
背景技术
在信息抽取(Information Extraction:IE)领域,事件抽取技术是从非结构化的信息中抽取出用户感兴趣的事件,并以结构化的形式呈现给用户。事件抽取主要面向于元事件(Meta Event),元事件表示一个动作的发生或者状态的变化。
近年来,事件抽取在金融、舆情等领域得到了广泛的应用。但是在短文本场景下,例如新闻摘要、微博短文本等,通常在较短的文本中包含了丰富的内容信息,可能一个触发词对应了多个元事件,此时传统的事件抽取方式仅能够抽取一个事件类的参数,并无法实现单个事件的抽取。
发明内容
本发明提供一种元事件抽取方法、装置、电子设备和存储介质,用以解决现有技术中短文本场景下无法实现单个事件抽取的缺陷。
本发明提供一种元事件抽取方法,包括:
确定待处理文本包含的触发词及其对应的各参数词;
抽取所述触发词对应的每两个参数词在所述待处理文本中的关系;
基于所述触发词对应的各参数词,以及每两个参数词之间的关系类型,构建所述触发词的参数关系图;
遍历所述触发词的参数关系图,得到所述触发词的各元事件。
根据本发明提供的一种元事件抽取方法,所述基于所述触发词对应的各参数词,以及每两个参数词之间的关系类型,构建所述触发词的参数关系图,包括:
以所述触发词对应的各参数词为节点,连接所述关系类型为存在关系的每两个参数词对应节点,得到所述参数关系图。
根据本发明提供的一种元事件抽取方法,所述遍历所述触发词的参数关系图,得到所述触发词的各元事件,包括:
基于所述参数关系图中各节点之间的连接关系,从所述参数关系图中抽取各节点集合,基于各节点集合确定各元事件;
所述节点集合内包含多个两两相连的节点。
根据本发明提供的一种元事件抽取方法,所述基于所述参数关系图中各节点之间的连接关系,从所述参数关系图中抽取各节点集合,包括:
从所述参数关系图中随机选择剪枝起始节点,若所述剪枝起始节点与所述参数关系图中的其余所有节点均连接,则将所述参数关系图中的所有节点作为一个节点集合;
否则,将删除所述剪枝起始节点后的参数关系图作为剪枝关系图;
从所述剪枝关系图中随机选择任一节点,若所述任一节点与所述剪枝关系图中的其余所有节点均连接,则将所述剪枝关系图中的所有节点作为一个节点集合,并重新选择所述剪枝起始节点;
否则,删除所述任一节点,并更新所述剪枝关系图。
根据本发明提供的一种元事件抽取方法,所述确定待处理文本包含的触发词及其对应的各参数词,包括:
对所述待处理文本进行事件触发词分类,得到所述待处理文本中各分词的触发词类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥讯飞数码科技有限公司,未经合肥讯飞数码科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110282621.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种赤松茸栽培种简易快繁方法
- 下一篇:激光雷达及扫地机器人