[发明专利]基于多层双向LSTM和验证模型的观点型问题阅读理解方法有效

专利信息
申请号: 201910180548.1 申请日: 2019-03-11
公开(公告)号: CN109933792B 公开(公告)日: 2020-03-24
发明(设计)人: 吴嘉琪;于建港;肖定和 申请(专利权)人: 海南中智信信息技术有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F40/30;G06N3/04;G06N5/04
代理公司: 广州三环专利商标代理有限公司 44202 代理人: 陈欢
地址: 570100 海南省海口*** 国省代码: 海南;46
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 多层 双向 lstm 验证 模型 观点 问题 阅读 理解 方法
【权利要求书】:

1.基于多层双向LSTM和验证模型的观点型问题阅读理解方法,其特征在于,所述方法包括以下步骤:

S1、对文章及问题中的句子进行预处理,所述预处理包括分词、词性标注、命名实体识别,将单词映射成词表当中对应的词向量,并与词性及命名实体类型的特征向量拼接在一起,形成文章和问题的初始特征向量表示;

S2、将文章与问题的初始特征向量表示分别通过第一层BiLSTM进行处理,得到文章和问题的浅层特征表示;

S3、将文章与问题的浅层特征表示进行推理建模,得到文章和问题具有推理关系的浅层特征表示,将文章和问题具有推理关系的浅层特征表示通过第二层BiLSTM进行处理,得到文章和问题具有相关性的深层特征表示;

S4、对问题中各单词的表示进行加权组合,形成问题的最终特征表示向量通过向量与文章的向量表示做内积,抽取出文章中能够用于回答问题的信息片段,再次通过注意力机制,对信息片段进行加权组合,形成文章的最终特征表示向量作为解码器的初始隐状态输入,对观点型问题的答案分为是、否、无法判断三个类别,在做内积抽取信息片段时,将三分类问题与信息片段作为联合任务进行建模,所述建模包括:将问题的最终特征表示和文章的最终特征表示进行串联,得到新特征表示sjoint;将sjoint输入到判别模型中,得到正确答案所属分类的概率,所述判别模型的DisQA Loss函数如公式(3)和(4)所示,

p(y|sjonit)=softmax((wssjoint+b)wy) (3)

其中,y为表示三个类别的向量,ws为特征的权重,wy为类别的权重,b为偏置量;

S5、使用一个单向LSTM作为解码器,并以文章的最终特征向量表示作为其输入序列,按照序列到序列的方式逐个单词地生成对应的候选答案;

S6、将能否从文章中获取到合理的候选答案的问题建模成二分类模型,通过二分类模型对得到的候选答案的合理性进行验证,具体包括以下步骤:将问题的最终特征表示和文章的最终特征表示进行串联,得到新特征表示sjoint;将sjoint输入到二分类验证模型中,通过将sjoint与权重做内积,得到sjoint的二维向量表示,从而得到所属类别的概率,所述二分类验证模型的VerQA Loss函数如公式(5)所示,

其中,m为训练样本个数,n为参数大小,θ为函数中的参数,λ是正则项系数;

S7、根据候选答案合理性对生成的答案文本进行处理,输出正确答案。

2.根据权利要求1所述的基于多层双向LSTM和验证模型的观点型问题阅读理解方法,其特征在于,步骤S3中,推理建模具体包括:假设得到的浅层特征表示对为<pi,qj>,计算特征表示对的点积作为注意力权重,对注意力权重进行归一化获得伴随向量,如公式(1)、(2)所示,

其中,pi为文章的伴随向量,qj为问题的伴随向量,lp为文章的伴随向量长度,lq为问题的伴随向量长度,aij为<pi,qj>的注意力权重,随后通过BiLSTM进行建模,得到具有推理性的文章特征表示和具有推理性的问题特征表示

3.根据权利要求1所述的基于多层双向LSTM和验证模型的观点型问题阅读理解方法,其特征在于,将步骤S6中得到的二维向量表示通过logistic regression函数进行处理得到一个概率分布,对概率分布进行优化。

4.根据权利要求1所述的基于多层双向LSTM和验证模型的观点型问题阅读理解方法,其特征在于,将问题的注意力加权组合向量与文章的最终向量表示做内积,其结果通过softmax函数转化为概率分布,对概率分布进行优化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海南中智信信息技术有限公司,未经海南中智信信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910180548.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top