[发明专利]一种基于段落内部推理和联合问题答案匹配的模型方法有效

专利信息
申请号: 201910073728.X 申请日: 2019-01-25
公开(公告)号: CN109947912B 公开(公告)日: 2020-06-23
发明(设计)人: 琚生根;孙界平;夏欣;王霞 申请(专利权)人: 四川大学
主分类号: G06F16/332 分类号: G06F16/332;G06N5/04;G06N3/04;G06N3/08;G06F40/253;G06F40/216;G06F40/295
代理公司: 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 代理人: 何健雄
地址: 610041 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 段落 内部 推理 联合 问题 答案 匹配 模型 方法
【权利要求书】:

1.一种基于段落内部推理和联合问题答案匹配的模型方法,其特征在于:包括以下步骤:

S1:对于每个候选答案构建一个向量,该向量表示段落与问题和答案的交互,然后所有候选答案的向量用于选择答案,具体步骤如下:

A:输入层,段落、问题和候选答案分别对应的表达为P={p1,p2,…,pm},Q={q1,q2,…,qn}和A={a1,a2,…,al},其中m,n和l是对应序列P,Q和A的长度,使用GloVe向量将每个词转换为对应的词嵌入,利用三个简单有效的词汇特征EM(P,Q),EM(Q,A)和EM(P,A)表明一个中的词是否在另一个中,其中EM(P,Q)为Q中的词是否在P中的向量表示,EM(Q,A)为Q中的词是否在A中的向量表示和EM(P,A)为A中的词是否在P中的向量表示;

B:编码层,步骤如下:

a:将词嵌入向量和完全匹配特征输入Highway Network,分别得到段落、问题和候选答案序列的表达向量其中HP*∈Rh×m,其中Hq∈Rh×n,其中Ha∈Rh×l

b:对段落进行k次压缩,压缩比例为{r1,r2,…,rk},对每个ri,首先将每隔ri个词的词嵌入相加进行压缩,段落长度变为m/ri,然后将得到的序列输入激活函数为ReLU的单层前向神经网络;

c:将得到的k个缩放操作得到的序列拼接输入到两层激活函数为ReLU的全连接前向神经网络;

C:交互层,利用注意力机制更新问题和候选答案的表达,使问题和候选答案的表达关注与段落相关的部分,注意力向量计算;

D:层次聚合,为了捕捉段落的句子结构,在共同匹配表达上构建了一个层次LSTM,首先将段落分成句子P1,P2,…,PN,其中N是段落中的句子数,对于每个{Pi,Q,A},i∈[1,N],通过输入、编码及交互层可以得到共同匹配表达Ci,然后在每个句子的共同匹配表达上应用两次BiLSTM层和最大池化层,以捕获共同匹配的句子级和篇章级表达;

E:输出层,对每个候选答案Ai,它最终交互表达为

S2:实验,具体步骤如下:

A:采用SemEval-2018Task 11任务的数据集MCScript,并且在RACE数据集进行预训练,MCScript数据集由Mechanical Turk的工作人员采用第一人称描述一个场景故事,旨在借用外部常识知识回答问题;

B:在PyTorch深度学习框架下实现模型,使用300维的Glove向量初始化词嵌入,且在训练期间不进行微调,k的取值为5,压缩比例r1=1,r2=2,r3=4,r4=10,r5=25,丢失率在0.1,0.2和0.3之间调整,优化器采用Adam,且初始学习率为0.002,批量大小为10,在MCScript数据集上进行30轮训练,在RACE数据集上10轮迭代。

2.根据权利要求1所述的一种基于段落内部推理和联合问题答案匹配的模型方法,其特征在于:所述步骤S1中编码层内的激活函数为ReLU的单层前向神经网络:

其中,Wa,ba是需要学习的参数,且对每个ri参数不共享,然后,再通过矩阵操作扩展到原来的序列长度m。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910073728.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top