[发明专利]基于图卷积网络的答案抽取方法、装置及相关组件在审
申请号: | 202011577396.8 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112632253A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 黄勇其;王伟;于翠翠;张兴 | 申请(专利权)人: | 润联软件系统(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/31;G06F40/211;G06F40/284;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 武志峰 |
地址: | 518000 广东省深圳市福田区梅林街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 网络 答案 抽取 方法 装置 相关 组件 | ||
1.一种基于图卷积网络的答案抽取方法,其特征在于,包括:
获取用户问题以及包含所述用户问题的文档;
基于句法依存分析对所述文档构建图网络;
利用图卷积网络,对所述文档与所述图网络进行融合,得到文档向量,以及对所述用户问题与所述图网络进行融合,得到问题向量;
基于所述图卷积网络和注意力机制对所述文档向量和问题向量进行学习,以获取所述文档中的答案起始概率和答案终止概率;
将所述答案起始概率和答案终止概率分别作为所述文档的起始索引和终止索引,并将所述起始索引和终止索引之间的文本作为所述用户问题的答案。
2.根据权利要求1所述的基于图卷积网络的答案抽取方法,其特征在于,所述获取用户问题以及包含所述用户问题的文档,包括:
获取用户问题以及包含所述用户问题的文档,利用预设的词向量模型分别对所述用户问题和文档进行学习,得到所述用户问题对应的第一词向量表示和所述文档对应的第二词向量表示。
3.根据权利要求1所述的基于图卷积网络的答案抽取方法,其特征在于,所述基于句法依存分析对所述文档构建图网络包括:
按句子对所述文档进行切分,并对切分后的每一句子进行分词,得到每一句子包含的字词;
针对每一句子,将每一字词作为所述图网络的图节点,获取各字词之间的依存关系,并根据各字词之间的依存关系连接对应的图节点;
获取各句子中相同的字词,并将所述相同的字词作为连接节点使不同的句子连接,从而构建得到所述文档的图网络。
4.根据权利要求2所述的基于图卷积网络的答案抽取方法,其特征在于,利用图卷积网络,对所述文档与所述图网络进行融合,得到文档向量,包括:
在所述图网络中获取与所述第二词向量表示相同的节点向量,并按照下列公式对所述第二词向量表示与节点向量进行融合:
new_x=x+node*σ(W1[x,node]+b1)
式中,σ为非线性激活函数,node为所述节点向量,x所述第二词向量表示,[x,node]表示所述第二词向量表示和节点向量进行拼接,W1为待训练权重矩阵,b1为偏置项,new_x为输出向量;
将所述输出向量new_x输入至前馈神经网络,并由所述前馈神经网络输出所述文档向量:
h=f(w3*f(w2new_x+b2)+b3)
式中,h为所述文档向量,w2、w3、b2和b3均为待训练参数,f为激活函数。
5.根据权利要求4所述的基于图卷积网络的答案抽取方法,其特征在于,基于所述图卷积网络和注意力机制对所述文档向量和问题向量进行学习,以获取所述文档中的答案起始概率和答案终止概率,包括:
将所述文档向量和问题向量输入至相互注意力层,并得到第一目标向量;
利用自注意力层对所述第一目标向量进行计算,得到第二目标向量;
将所述第二目标向量和所述文档向量输入至特征融合层,并得到第三目标向量;
将所述第三目标向量输入至输出层,并由所述输出层输出对应的答案起始概率和答案终止概率。
6.根据权利要求5所述的基于图卷积网络的答案抽取方法,其特征在于,所述将所述第二目标向量和所述文档向量输入至特征融合层,并得到第三目标向量,包括:
将所述第二目标向量和所述文档向量输入至特征融合层,并按照下列公式计算得到所述第三目标向量:
v=m+x*σ(W4[x,m]+b4)
式中,v为所述第三目标向量,W4和b4为可训练参数,m为所述第二目标向量,x为所述文档向量,σ为激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于润联软件系统(深圳)有限公司,未经润联软件系统(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011577396.8/1.html,转载请声明来源钻瓜专利网。