[发明专利]一种基于分层策略网络的事件抽取方法及设备在审
| 申请号: | 202110022760.2 | 申请日: | 2021-01-08 |
| 公开(公告)号: | CN112836504A | 公开(公告)日: | 2021-05-25 |
| 发明(设计)人: | 赵翔;黄培馨;谭真;胡升泽;肖卫东;胡艳丽;张军;李硕豪 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | G06F40/284 | 分类号: | G06F40/284;G06N3/08;G06N3/04;G06K9/62 |
| 代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
| 地址: | 410073 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分层 策略 网络 事件 抽取 方法 设备 | ||
1.一种基于分层策略网络的事件抽取方法,其特征在于,包括以下步骤:
步骤1,构建分层策略网络,所述的分层策略网络包括事件级策略网络、论元级策略网络和角色级决策网络;
步骤2,在从句子头向句子尾扫描的过程中,所述的事件级策略网络在每个分词处检测触发词并且对检测出来的触发词分类事件类型;
步骤3,一旦一个特定的事件被检测出来,所述的论元级策略网络将被触发,开始从头到尾扫描句子,以检测当前这个事件的参与论元;
步骤4,一旦一个论元被识别出来,角色级策略网络将被触发,以预测当前事件下,这个论元在事件中扮演的角色;
步骤5,当角色级策略网络角色分类完成,论元级策略网络会继续扫描之后的句子来寻找下一个论元,一旦当前事件下的论元级策略网络完成论元检测,事件级的策略网络将继续从当前事件的分词处往后扫描句子来检测句子包含的其他事件直到扫描到句子尾。
2.根据权利要求1所述的一种基于分层策略网络的事件抽取方法,其特征在于,采用智能体进行上述步骤2-5的执行,步骤2中,当智能体从头到尾顺序扫描句子时,所述的事件级策略网络在每个时间步持续根据策略来对选择进行采样,事件级选择通常包括非触发词或者触发词的特定事件类型集合;
步骤3中,一个特定的事件被检测到,智能体将会转移至所述的论元级策略网络,从头到尾扫描句子时,在每个时间步根据策略来选择一个行动,论元级行动是对分词赋予一个特定的论元标签;
步骤4中,一个特定的论元被检测出,智能体会转移至角色级网络对当前论元根据策略采样选择,角色级选择是角色类型的集合;
步骤5中,当论元的角色分类完成后,智能体会转移至论元级策略网络继续扫描句子剩余的分词识别事件的其余论元,一旦当前事件下智能体结束对当前事件的参与论元的检测,智能体将会转移至事件级策略网络继续扫描剩下的句子识别其他的事件;
在步骤2-5中,一旦一个选择或行动被采样到,就会有一个奖励被返回。
3.根据权利要求2所述的一种基于分层策略网络的事件抽取方法,其特征在于,给定输入文本S=w1,w2,...,wL,所述的事件级策略网络的目的是检测触发词wi所触发的事件类型,在当前词或时间步t处,事件级策略网络会采取随机策略μ来确定选择,然后使用获得的奖励来引导策略网络的策略学习;
所述的事件级策略网络的选择是从一个选择集合Oe={NE}∪ε中采样得来,其中NE代表非触发词的分词,ε是数据集中预先定义好的事件类型集合,用于指示当前触发词所触发的事件类型;
所述的事件级策略网络过程的状态是与过去时间步相关的,不仅编码当前输入,还编码了先前的环境状态,是以下三个向量的联结:1)上一时间步的状态st-1,其中如果智能体在时间步t-1发起了事件级策略过程,则st-1=st-1e;否则st-1=st-1r,st-1e表示t-1时间步事件级策略网络的环境状态,st-1r表示t-1时间步角色级策略网络的环境状态,2)事件类型向量是从满足的上一个选择学习而来,3)隐层状态向量ht,它是在当前输入词向量wt上进行Bi-LSTM获得的隐层状态向量,通过Bi-LSTM处理文本分词序列得到:
由此,表示为:
最后,使用多层感知器MLP将状态表示为一个连续的实值向量
所述的事件级策略网络中的随机策略,即进行某个选择的策略,μ:Se→Oe,它采样一个选择根据如下的概率分布:
其中,We和be是参数,是状态表示向量;
所述的事件级策略网络的奖励最终的目的是识别和分类事件,触发词正确与否是中间结果,一旦事件级选择被采样,智能体将获得一个即时的奖励,这个奖励能够反映在选择下的短期回报,即时奖励通过对比句子S中事件类型的标准注释得到:
其中sgn(·)是符号函数,I(NE)是一个用来区分触发词和非触发词的奖励的开关函数:
其中α是偏置权重,α<1,α越小,识别出非触发词获得的奖励更小,这能够避免模型学习到不重要的策略,去将所有的词都预测为NE,即非触发词;
当事件级策略网络采样选择直至句子S中的最后一个词,智能体结束所有事件级选择之后,会获得一个最终奖励这个最终状态的延迟reward由句子级事件检测表现定义:
其中F1(·)表示句子级事件检测结果的F1分数,是句子级精确率和召回率的调和平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110022760.2/1.html,转载请声明来源钻瓜专利网。





