[发明专利]一种问答任务的下游任务处理方法及模型有效
| 申请号: | 202011539404.X | 申请日: | 2020-12-23 |
| 公开(公告)号: | CN112732879B | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 王勇;雷冲;陈秋怡 | 申请(专利权)人: | 重庆理工大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06N3/04;G06N3/08 |
| 代理公司: | 重庆博凯知识产权代理有限公司 50212 | 代理人: | 胡逸然 |
| 地址: | 400054 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 问答 任务 下游 处理 方法 模型 | ||
1.一种问答任务的下游任务处理方法,其特征在于,包括如下步骤:
S1、将问题与上下文输入预训练语言模块,获取上下文的语言关联特征;
S2、利用双向注意力机制基于上下文的语言关联特征得到关键信息感知的上下文表示HCKey以及关键信息感知的问题表示HQKey;
S3、利用双向注意力流基于关键信息感知的上下文表示HCKey以及关键信息感知的问题表示HQKey,得到问题感知的上下文表示G;
S4、利用门机制基于问题感知的上下文表示G计算更新向量z和记忆权重g,利用更新向量z和记忆权重g更新问题感知的上下文表示G得到输出向量Gg;
S5、利用粒计算基于上下文的语言关联特征生成上下文粒度向量GC及序列粒度向量GCLS,基于上下文粒度向量GC、序列粒度向量GCLS及输出向量Gg生成多角度理解上下文以及上下文总体与局部的关系的输出向量Cout;
S6、将基于上下文的语言关联特征生成多角度理解上下文以及上下文总体与局部的关系的输出向量Cout通过线性层处理后,使用softmax计算上下文中每个字作为答案起止位置的概率,抽取概率最大的连续子序列作为答案。
2.如权利要求1所述的问答任务的下游任务处理方法,其特征在于,上下文的语言关联特征为H,H={h1,h2,h3,...,hs},h1至hs表示上下文和问题拼接成的序列经过编码器编码后的表示,S表示上下文和问题拼接成的序列长度,步骤S2包括:
S201、基于上下文和问题在H中的位置,截取问题截取部分HQ和上下文截取部分HC,HQ={h2,h3,h4,...,hn+1},HC={hn+3,hn+4,...,hn+m+2},n表示问题词的长度,m表示上下文词的长度;
S202、构建相似性矩阵S,
S=WS(HC,HQ,HC·HQ)
式中,WS为一个可训练矩阵;
S203、分别对相似性矩阵S的每行和每列进行softmax运算,得到S1和S2,S1表示对于每个上下文词,所有的问题词与之的相关性;S2表示对于每个问题词,所有的上下文词与之的相关性;S1=softmax→(S),S2=softmax↓(S);
S204、突出问题关键词和上下文关键词权重;
S205、基于下式生成关键信息感知的上下文表示HCKey以及关键信息感知的问题表示HQKey:
HCKey=HC+HC⊙AC
HQKey=HQ+HQ⊙AQ
式中,AC表示与问题关键词相关联的上下文关键部分注意力,AQ表示与上下文关键词相关联的问题关键部分注意力;
AC=S2·SQkey
AQ=S1·SCkey
式中,SQkey表示突出关键词的问题权重,SCkey表示突出关键词的上下文权重;
SQkey=mean↓(S1)
SCkey=mean→(S2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆理工大学,未经重庆理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011539404.X/1.html,转载请声明来源钻瓜专利网。





