[发明专利]一种实体关系抽取方法及装置在审
申请号: | 201911179314.1 | 申请日: | 2019-11-27 |
公开(公告)号: | CN111008279A | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 曾祥荣 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/953;G06K9/62 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实体 关系 抽取 方法 装置 | ||
1.一种实体关系抽取方法,其特征在于,包括:
将预处理的词序列信息输入神经网络;
对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
抽取所有关系三元组,并在预设时刻结束。
2.如权利要求1所述的方法,其特征在于,所述得到输入词序列信息的编码表示,包括:
对输入词序列进行定义;
对所述输入词序列进行词向量预处理,得到词向量矩阵;
对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示。
3.如权利要求1所述的方法,其特征在于,所述利用拷贝机制进行解码,得到三元组,包括:
定义解码器的解码时刻;
通过计算,得到解码器在解码时刻的输出向量和隐状态;
对所述输出向量进行分类操作,得到所述三元组中的两个相关实体的关系以及两个相关实体。
4.如权利要求3所述的方法,其特征在于,所述得到所述三元组中的两个相关实体的关系以及两个相关实体,包括:
对输出向量进行分类操作,得到预测的关系;
对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
5.如权利要求1所述的方法,其特征在于,所述抽取所有关系三元组,并在预设时间结束,包括:
解码时刻小于所述预设时刻,继续抽取三元组;
解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
6.一种实体关系抽取装置,其特征在于,包括:
输入模块,用于将预处理的词序列信息输入神经网络;
编码模块,用于对所述预处理的词序列信息进行编码,得到输入词序列信息的编码表示;
解码模块,用于对所述输入词序列信息的编码表示利用拷贝机制进行解码,得到三元组;
抽取模块,用于抽取所有关系三元组,并在预设时刻结束。
7.如权利要求6所述的装置,其特征在于,所述编码模块,包括:
词序列定义单元,用于对输入词序列进行定义;
预处理单元,用于对所述输入词序列进行词向量预处理,得到词向量矩阵;
编码计算单元,用于对所述词向量矩阵中的词向量进行计算,得到所述输入词序列信息的编码表示。
8.如权利要求6所述的装置,其特征在于,所述解码模块,包括:
时刻定义单元,用于定义解码器的解码时刻;
解码计算单元,用于通过计算,得到解码器在解码时刻的输出向量和隐状态;
分类单元,用于对所述输出向量进行分类操作,得到所述三元组中的两个相关实体以及两个相关实体的关系。
9.如权利要求8所述的装置,其特征在于,所述分类单元,包括:
分类子单元,用于对输出向量进行分类操作,得到预测的关系;
第一复制子单元,用于对所述输入词序列中的第一目标词进行复制,得到第一目标词的复制对象,将第一目标词的复制对象作为第一个实体;
第二复制子单元,用于对所述输入词序列中的第二目标词进行复制,得到第二目标词的复制对象,将第二目标词的复制对象作为第二个实体。
10.如权利要求6所述的装置,其特征在于,所述抽取模块,包括:
判断单元,用于解码时刻小于所述预设时刻,继续抽取三元组;
所述判断单元,还用于解码时刻等于所述预设时刻,结束抽取,解码器生成的输出序列按顺序每三个元素为一个关系三元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911179314.1/1.html,转载请声明来源钻瓜专利网。