[发明专利]基于强化学习的事件论元抽取方法及装置有效
申请号: | 202010552821.1 | 申请日: | 2020-06-17 |
公开(公告)号: | CN111797241B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 张世琨;叶蔚;习翔宇;张君福;胡文蕙;刘学洋 | 申请(专利权)人: | 北京北大软件工程股份有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35 |
代理公司: | 北京细软智谷知识产权代理有限责任公司 11471 | 代理人: | 谭承世 |
地址: | 100089 北京市海淀区北四环西路67号中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 事件 抽取 方法 装置 | ||
1.一种基于强化学习的事件论元抽取方法,其特征在于,包括:
构建事件检测模型,所述事件检测模型检测句子中的触发词并根据所述触发词进行事件类型预测;其中,所述句子包括触发词和实体;
构建论元检测模型,所述论元检测模根据预测的事件类型对事件的每个触发词和每个实体两两之间进行论元检测;
构建实体选择模型,所述实体选择模型从未检测的实体集合中确定待检测实体;根据当前的环境信息,计算句子中所有实体被选择进行检测的概率,将概率最高的实体确定为待检测实体;
将所述实体选择模型选择的待检测实体输入到所述论元检测模型进行检测,采集预测结果的损失,根据所述预测结果的损失更新所述论元检测模型的参数;根据所述待检测实体更新所述实体选择模型;
通过更新后的论元检测模型和更新后的实体选择模型对所述句子中的实体进行检测,并将检测结果引入更新后的论元检测模型和更新后的实体选择模型进行更新,循环直至遍历所有实体,确定并输出论元集合。
2.根据权利要求1所述的抽取方法,其特征在于,所述构建事件检测模型,包括:
采用双向长短期记忆条件随机场模型对文本数据进行标注;
采用已标注文本数据对事件检测模型进行训练,直至收敛,输出事件检测模型。
3.根据权利要求1所述的抽取方法,其特征在于,所述构建论元检测模型,包括:
对所述论元检测模型进行预训练,采用从左往右遍历的方式来选择实体,采用真实的实体、论元角色信息作为特征。
4.根据权利要求1所述的抽取方法,其特征在于,所述构建实体选择模型,包括:
向所述实体选择模型中输入环境信息;
所述环境信息包括:句子信息、实体信息、所述实体信息包括实体类型、事件的触发词信息、所述触发词信息包括事件类型、已预测出的实体类别信息。
5.根据权利要求4所述的抽取方法,其特征在于,所述论元检测模型,包括:
嵌入层,用于构造事件的每个词的向量表示,获取词向量;
卷积层,用于对所述词向量进行卷积操作;
池化层,用于对卷积操作后的词向量进行最大池化操作,获取事件和实体构成的二元组的向量表示;
分类层,用于采用全连接网络和Softmax操作对实体向量属于事件向量的角色进行分类。
6.根据权利要求5所述的抽取方法,其特征在于,所述实体选择模型,包括:
嵌入层,用于构造事件的每个词的向量表示;
双向递归神经网络层,用于采用双向递归结构对所述嵌入层输出的句子进行表示并输出;
事件信息增强层,用于将事件类别引入到所述双向递归神经网络层的输出中;
线性映射层,用于对事件信息增强层输出的向量进行矩阵乘法操作,并将操作后的字符映射到二维向量,表示实体被选择进行检测的概率;
输出层,用于屏蔽已经选择的实体的字符向量或者非实体的字符向量,选择概率最大的实体。
7.根据权利要求1所述的抽取方法,其特征在于,
采用Adam优化器更新论元检测模型的参数。
8.根据权利要求5所述的抽取方法,其特征在于,
所述卷积层采用长度为3、数量为300的卷积核进行操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京北大软件工程股份有限公司,未经北京北大软件工程股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010552821.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光检测器件及电子装置
- 下一篇:光检测器件及电子装置