[发明专利]一种基于动态路由机制的机器阅读理解网络模型的建立方法、方法、存储介质及终端有效
申请号: | 201910765132.6 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110457710B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 李晓瑜;段艺文;胡孙强;黄海滔;洪磊;郑德生 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04 |
代理公司: | 成都华风专利事务所(普通合伙) 51223 | 代理人: | 张巨箭 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 路由 机制 机器 阅读 理解 网络 模型 建立 方法 存储 介质 终端 | ||
1.一种基于动态路由机制的机器阅读理解网络模型的建立方法,其特征在于:它包括:
基础编码层:用于完成对输入文本段落和问题序列的交互匹配式编码,并最终以向量序列的形式输出对输入信息的编码;所述基础编码层包括BiDAF和BERT,其中,BiDAF是一个分阶段的多层过程,其由字符嵌入层、词嵌入层、上下文嵌入层、注意力流层、建模层和输出层构成;BERT通过将TokenEmbedings,SegmentEmbedings,PositionEmbedings三个向量组加和得到每个词的嵌入向量,BERT将文本段落和问题序列映射为TokenEmbedings后用[SEP]分隔符分开作为输入;
路由解码层:用于接收来自所述基础编码层的向量序列,经过多层动态路由层解码映射成高级语义特征向量并进行适应性的轻微重编码后输出;所述路由解码层包括由多个动态路由层以级联的方式堆叠而成,每个动态路由层包括由一层胶囊网络层和一层双向LSTM层组成;
所述胶囊网络层接收来自所述基础编码层的向量序列,并将这些携带问题序列和段落交互信息的编码向量解码映射成高级语义特征向量;所述双向LSTM层在阅读理解所述高级语义特征向量的基础上对所述高级语义特征向量进行适应性的轻微重编码;
输出层:将所述动态路由层输出的高级语义特征向量经过处理得到答案并输出。
2.一种基于动态路由机制的机器阅读理解方法,其特征在于:所述方法包括以下内容:
路由解码层中最底层的胶囊网络层接收来自基础编码层的向量序列,经过多层动态路由层解码映射成高级语义特征向量并进行适应性的轻微重编码后输出,所述路由解码层包括由多个动态路由层以级联的方式堆叠而成,每个动态路由层包括由一层胶囊网络层和一层双向LSTM层组成;所述胶囊网络层接收来自所述基础编码层的向量序列并将这些携带问题序列和段落交互信息的编码向量解码映射成高级语义特征向量;
所述胶囊网络层将携带问题序列和段落交互信息的编码向量解码映射成高级语义特征向量的具体步骤如下:
将经过编码后的向量ui进行仿射变换,得到仿射变换后的结果对进行r次迭代并计算每次迭代过程中表示上一层胶囊层的第i个输入与下一层胶囊层的第j个输出之间连接的耦合系数cij;
计算中间变量Sj,通过压缩函数squash()得到压缩后的输出vj;
双向LSTM层在阅读理解所有高级语义特征向量的基础上对高级语义特征向量进行适应性的轻微重编码;所述双向LSTM层在阅读理解所有高级语义特征向量的基础上对高级语义特征向量进行适应性的轻微重编码的具体步骤如下:
通过前向LSTM层获取上文的高级语义特征向量;
通过后向LSTM层获取下文的高级语义特征向量;
将前向和后向的高级语义特征向量进行拼接得到重编码后的向量;
重复步骤二和步骤三直到所有高级语义特征向量被映射提取以及轻微重编码后输入到输出层;
还包括输入文本段落和问题序列到基础编码层进行交互匹配式编码并输出编码后的向量序列到所述胶囊网络层的步骤;
还包括输出层对路由解码层的输出经过处理后输出答案的起始位置和结束位置的步骤。
3.一种存储介质,其内部存储有计算机程序指令,其特征在于:所述计算机程序指令运行时执行权利要求2所述的一种基于动态路由机制的机器阅读理解方法的步骤。
4.一种终端,包括存储器和处理器,所述存储器上存储有可以在所述处理器上运行的计算机程序指令,其特征在于:所述处理器运行所述计算机程序指令时执行权利要求2所述的一种基于动态路由机制的机器阅读理解方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910765132.6/1.html,转载请声明来源钻瓜专利网。