[发明专利]基于强化学习的事件论元抽取方法及装置有效

专利信息
申请号: 202010552821.1 申请日: 2020-06-17
公开(公告)号: CN111797241B 公开(公告)日: 2023-08-22
发明(设计)人: 张世琨;叶蔚;习翔宇;张君福;胡文蕙;刘学洋 申请(专利权)人: 北京北大软件工程股份有限公司
主分类号: G06F16/36 分类号: G06F16/36;G06F16/35
代理公司: 北京细软智谷知识产权代理有限责任公司 11471 代理人: 谭承世
地址: 100089 北京市海淀区北四环西路67号中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 强化 学习 事件 抽取 方法 装置
【权利要求书】:

1.一种基于强化学习的事件论元抽取方法,其特征在于,包括:

构建事件检测模型,所述事件检测模型检测句子中的触发词并根据所述触发词进行事件类型预测;其中,所述句子包括触发词和实体;

构建论元检测模型,所述论元检测模根据预测的事件类型对事件的每个触发词和每个实体两两之间进行论元检测;

构建实体选择模型,所述实体选择模型从未检测的实体集合中确定待检测实体;根据当前的环境信息,计算句子中所有实体被选择进行检测的概率,将概率最高的实体确定为待检测实体;

将所述实体选择模型选择的待检测实体输入到所述论元检测模型进行检测,采集预测结果的损失,根据所述预测结果的损失更新所述论元检测模型的参数;根据所述待检测实体更新所述实体选择模型;

通过更新后的论元检测模型和更新后的实体选择模型对所述句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体,确定并输出论元集合。

2.根据权利要求1所述的抽取方法,其特征在于,所述构建事件检测模型,包括:

采用双向长短期记忆条件随机场模型对文本数据进行标注;

采用已标注文本数据对事件检测模型进行训练,直至收敛,输出事件检测模型。

3.根据权利要求1所述的抽取方法,其特征在于,所述构建论元检测模型,包括:

对所述论元检测模型进行预训练,采用从左往右遍历的方式来选择实体,采用真实的实体、论元角色信息作为特征。

4.根据权利要求1所述的抽取方法,其特征在于,所述构建实体选择模型,包括:

向所述实体选择模型中输入环境信息;

所述环境信息包括:句子信息、实体信息、所述实体信息包括实体类型、事件的触发词信息、所述触发词信息包括事件类型、已预测出的实体类别信息。

5.根据权利要求4所述的抽取方法,其特征在于,所述论元检测模型,包括:

嵌入层,用于构造事件的每个词的向量表示,获取词向量;

卷积层,用于对所述词向量进行卷积操作;

池化层,用于对卷积操作后的词向量进行最大池化操作,获取事件和实体构成的二元组的向量表示;

分类层,用于采用全连接网络和Softmax操作对实体向量属于事件向量的角色进行分类。

6.根据权利要求5所述的抽取方法,其特征在于,所述实体选择模型,包括:

嵌入层,用于构造事件的每个词的向量表示;

双向递归神经网络层,用于采用双向递归结构对所述嵌入层输出的句子进行表示并输出;

事件信息增强层,用于将事件类别引入到所述双向递归神经网络层的输出中;

线性映射层,用于对事件信息增强层输出的向量进行矩阵乘法操作,并将操作后的字符映射到二维向量,表示实体被选择进行检测的概率;

输出层,用于屏蔽已经选择的实体的字符向量或者非实体的字符向量,选择概率最大的实体。

7.根据权利要求1所述的抽取方法,其特征在于,

采用Adam优化器更新论元检测模型的参数。

8.根据权利要求5所述的抽取方法,其特征在于,

所述卷积层采用长度为3、数量为300的卷积核进行操作。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大软件工程股份有限公司,未经北京北大软件工程股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010552821.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top