[发明专利]一种基于神经网络的开放式关系抽取方法在审
申请号: | 201910928309.X | 申请日: | 2019-09-28 |
公开(公告)号: | CN110956040A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 张辉;王德庆;梁满庭;郝瑞 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京汲智翼成知识产权代理事务所(普通合伙) 11381 | 代理人: | 陈曦;贾兴昌 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 开放式 关系 抽取 方法 | ||
1.一种基于神经网络的开放式关系抽取方法,其特征在于包括如下步骤:
将微生物领域数据中的生物实体概念替换为相应的概念类型得到输入数据;
构建层级递归神经网络解码器;
将得到的输入数据输入到层级递归神经网络解码器,得到半结构化的输出数据。
2.如权利要求1所述的基于神经网络的开放式关系抽取方法,其特征在于将微生物领域数据中的生物实体概念替换为相应的概念类型得到输入数据,包括如下步骤:
以词典匹配的方式对文本中的微生物领域概念进行识别;
标注语句中每个领域内单词所属的概念类型;
识别生物学领域数据中的生僻词语,将其替换为对应的概念类型,得到输入数据。
3.如权利要求1所述的基于神经网络的开放式关系抽取方法,其特征在于构建层级递归神经网络解码器,包括如下步骤:
根据层级递归神经网络划分层级,在顶层设置内部解码单元;
在除顶层之外的每个层级均设置共轭解码单元;
所述共轭解码单元包括边缘判断分类器、内部解码单元和内部编码单元;
其中,所述边缘判断分类器用于感知所在层级的划分边界;
所述内部编码单元对来自于下一层的输入进行编码,并在到达当前层的层级的划分边界时,向当前层的上一层传递编码信息;
所述内部解码单元根据上一层的输入、内部编码单元下一层的输出以及内部解码器的隐藏状态,对内部解码单元下一层的输出进行预测。
4.如权利要求1所述的基于神经网络的开放式关系抽取方法,其特征在于将得到的输入数据输入到层级递归神经网络解码器,得到半结构化的输出数据,包括如下步骤:
层级递归神经网络顶层的内部解码单元对输入数据进行解码生成语义片段信息;
根据上层解码单元生成的语义片段信息,由内部编码单元逐一生成下一层粒度的语义信息,并将生成的语义信息经由内部编码单元进行再编码,生成再编码信息;
当边缘判断分类器判定内部解码单元处于划分边界时,停止解码,并将再编码信息返回。
5.如权利要求4所述的基于神经网络的开放式关系抽取方法,其特征在于:
t时刻,第1层的内部解码单元的输入包括:来自l-1层的边缘信号、l-1层内部编码单元的输出信号、t-1时刻的内部解码单元的隐藏状态、t-1时刻的内部编码单元的隐藏状态、t时刻l+1层内部解码单元的输出。
6.如权利要求5所述的基于神经网络的开放式关系抽取方法,其特征在于:
当l-1层内部编码单元的输出信号为0时,第l-1层未到达划分边界,第l层保持原有状态,无任何操作。
7.如权利要求5所述的基于神经网络的开放式关系抽取方法,其特征在于:
当l-1层内部编码单元的输出信号为1,l层内部编码单元的输出信号为0时,第l-1层到达划分边界,第l层未到达划分边界,l层的编码单元将l-1层编码单元的输出作为l层解码单元的输入生成新的状态dol,t,并输出到l-1层,l-1层的解码单元以dol,t为l-1层新片段的初始状态;其中,dol,t,为t时刻l层共轭解码单的输出。
8.如权利要求5所述的基于神经网络的开放式关系抽取方法,其特征在于:
当l-1层和l层内部编码单元的输出信号均为1时,l层与l-1层同时到达划分边界;第l层内部编码单元将第l-1层的编码结果作为当前片段的最后一条信息编入内部解码单元的隐藏状态并向上传递,同时丢弃其当前的编码状态;内部解码单元在完成t时刻解码后,丢弃其解码状态,并从(l+1层)获取下一个片段的新的解码信息作为内部解码单元的隐藏状态。
9.如权利要求1所述的基于神经网络的开放式关系抽取方法,其特征在于:
进行优化时基于损失函数,通过梯度下降法进行解码器优化;
其中,所述损失函数是边界判断结果的交叉熵以及生成序列结果的交叉熵。
10.如权利要求1所述的基于神经网络的开放式关系抽取方法,其特征在于:
所述输出数据以元组为单位,元组内各个单词在原句中的平均位置靠前,则该元组在生成的元组序列中靠前。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910928309.X/1.html,转载请声明来源钻瓜专利网。