[发明专利]一种少样本机器阅读理解方法、系统、设备及存储介质有效
| 申请号: | 202210093014.7 | 申请日: | 2022-01-26 |
| 公开(公告)号: | CN114444488B | 公开(公告)日: | 2023-03-24 |
| 发明(设计)人: | 毛震东;张勇东;彭奕兴;张立成 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/30;G06N20/00 |
| 代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 样本 机器 阅读 理解 方法 系统 设备 存储 介质 | ||
1.一种少样本机器阅读理解方法,其特征在于,包括:
训练阶段,将包含问题文本、带掩码的提示模板伪token和上下文文本的训练文本通过提示模板编码器,获得带有连续提示模板的输入数据;将所述输入数据输入至包含双向编码器与自回归解码器的双向自回归语言模型,通过所述双向编码器对所述输入数据进行编码,利用给定的期望输出的答案构造所述自回归解码器输入信息,通过自回归解码器的自注意力机制进行处理后,采用交互注意力机制与所述双向编码器的输出进行交互,获得解码向量;利用所述解码向量计算各个生成词的概率分布,并构建损失函数对所述提示模板编码器与双向自回归语言模型进行训练;
预测阶段,将给定的包含问题文本、带掩码的提示模板伪token和上下文文本的输入文本,依次通过提示模板编码器以及双向自回归语言模型,获得答案文本;
所述包含问题文本、带掩码的提示模板伪token和上下文文本的训练文本表示为:
Input=Question:xq;p1,...,pn:[mask];Context:xc
其中,Question表示问题,xq表示问题文本;p1,...,pn表示随机产生的提示模板伪token,n表示token的数目,token表示词标记;[mask]为掩码符号;Context表示上下文,xc表示上下文文本;
所述训练文本通过提示模板编码器,获得带有连续提示模板的输入数据包括:
先将训练文本经过tokenizer得到全部的token,再输入至嵌入层,得到初始词嵌入向量Embraw:
Embraw=Embraw[0:s];Embraw[s:e];Embraw[e:]
其中,s表示伪token的起始位置,token表示词标记,e表示伪token结束位置;Embraw[0:s]表示问题文本的初始词嵌入向量,Embraw[s:e]表示带掩码的提示模板伪token的初始词嵌入向量,Embraw[e:]表示上下文文本的初始词嵌入向量;
将带掩码的提示模板伪token的初始词嵌入向量Embraw[s:e]输入至提示模板编码器,获得新的词嵌入向量Embnew[s:e]:
Embnew[s:e]=P_Encoder(Embraw[s:e])
其中,P_Encoder表示提示模板编码器;
利用新的词嵌入向量Embnew[s:e]替换初始词嵌入向量Embraw中的Embraw[s:e],获得的词嵌入向量Embnew即为获得带有连续提示模板的输入数据:
Embnew=Embraw[0:s];Embnew[s:e];Embraw[e:];
所述利用给定的期望输出的答案构造所述自回归解码器输入信息,通过自回归解码器的自注意力机制进行处理后,采用交互注意力机制与所述双向编码器的输出进行交互,获得解码向量包括:
将自回归解码器的期望输出y表示为:
y=Question:xq;p1,...,pn:ya
其中,Question表示问题,xq表示问题文本;p1,...,pn表示提示模板伪token,ya表示给定的期望输出的答案;
将y右移一位并在第一位补充一个开始符号<sos>后,记为y’,y’对应的词嵌入向量EmbD表示为:
EmbD=Emb<sos>;Embnew[0:sm];Embya
其中,Emb<sos>为开始符号<sos>对应的词嵌入向量,sm为带掩码的提示模板伪token中掩码符号[mask]所在的位置,Embnew[0:sm]为输入数据Embnew中包含问题文本部分Question:xq与带掩码的提示模板伪token从第1个token到sm位置处的词嵌入向量,Embya为ya对应的词嵌入向量;
将y′对应的词嵌入向量EmbD通过自注意力机制处理为向量Y,再结合双向编码器输出的编码向量H通过交互注意力机制进行处理,最终得到解码向量HD。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210093014.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:发声器
- 下一篇:全流程尼龙66盐生产废水处理方法





