[发明专利]基于尾句-上下文双重注意力模型的多轮对话生成方法有效
申请号: | 201910554079.5 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110413729B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 孙俊;张国栋;吴豪;吴小俊;方伟;陈祺东;李超;游琪;冒钟杰 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 基于尾句‑上下文双重注意力模型的多轮对话生成方法,属于人机对话领域。一个合适的回复应该是符合最后一个句子的语义且能够利用到整个上下文的信息。当前多轮对话生成主要基于层次的编码器‑解码器结构。本发明提出了一个尾句‑上下文双重注意力模型。每句话都通过编码器获取句子的语义表示。对最后一句话中每个词做注意力,同时对每句话的语义表示做注意力。二者拼接作为解码阶段的上下文向量。此外,本发明还引入了多头自注意力机制使得在获取每句话的语义表示时能更关注于关键的词。实验证明本发明方法的模型在自动评价和人工评价两个方面都超出了基准模型。 | ||
搜索关键词: | 基于 上下文 双重 注意力 模型 轮对 生成 方法 | ||
【主权项】:
1.基于尾句‑上下文双重注意力模型的多轮对话生成方法,其特征在于,步骤如下:步骤1:设一段对话,包含的上下文语句为U=(u1,...ui,...un),其对应的一个回复为Y=(y1,...yj,...ym),其中n为上下文语句的数量,m为回复语句中词的数量;对于任意一个语句ui,Wi=(wi,1,...wi,k,...wi,p)为该句中的词,其中p为词的数量;尾句‑上下文双重注意力模型接收n个句子u1,...ui,...un作为输入;步骤2:对于语句ui中的词wi,1,...wi,k,...wi,p,对每个词做多头自注意力计算,得到W'i=(w'i,1,...w'i,k,...w'i,p),公式如下:w'i,k=MultiHead(wi,k,wi,k,wi,k)=Concat(head1,...,headh)WO其中,wi,k代表ui中第k个单词,w'i,k代表经过多头自注意力计算后的词向量;MultiHead(g)表示多头注意力方法,Concat(g)表示拼接操作,h是多头注意力中线性变换个数;headi=Attention(wi,kWiQ,wi,kWiK,wi,kWiV),其中Attention(g)表示缩放点击注意力方法,它接收三个参数Q,K,V,定义为
dk为Q的维度;在本模型中Q=wi,kWiQ,K=wi,kWiK,V=wi,kWiV;WiQ、WiK、WiV、WO为预设参数矩阵,softmax(g)为激活函数;步骤3:对于语句ui中经过多头自注意力计算的到的词w'i,1,...w'i,k,...w'i,p,从第一个单词开始通过GRU计算加密隐函数,hi,k=f(w'i,k,hi,k‑1),其中hi,0记为预设参数;将最后一个计算完毕的hi,p作为整个句子ui的加密隐函数hi:hi=GRU(w'i,1,...w'i,k,...w'i,p),将每个上下文语句都按上文计算,得到所有上下文语句的句子表示H=(h1,...hi,...hn);步骤4:计算上下文每个句子的注意力权重:
其中ei,t=VTtanh(Whi+Ust‑1),V、W、U均为注意力机制中的预设参数矩阵,t代表解码的每个时刻,tanh为激活函数,st‑1是解码器在t‑1时刻的隐藏状态;由得到的每句句子的权重计算上下文语境表示向量
步骤5:对于末尾语句un,Wn=(wn,1,...wn,k,...wn,p)是句中的词,计算末尾语句un中每个词的注意力权重:
其中ek,t=V'Ttanh(W'wn,k+U'st‑1),V'、W'、U'均为注意力机制中的预设参数矩阵,tanh为激活函数;由得到的每个词的权重计算末尾句的语境表示向量
步骤6:将末尾语句和整个上下文语句两个语境表示向量拼接起来作为最终的语境表示向量Ct=[ct;c't];步骤7:针对末尾句子un,从第一个单词开始通过GRU计算加密隐函数,h'n,k=f(wi,k,h'n,k‑1),其中h'n,0记为预设参数;将最后一个计算完毕的h'n,p作为整个句子un的加密隐函数h'n;步骤8:计算t时刻解码器的隐藏状态:st=f(yt‑1,st‑1,Ct),yt‑1表示t‑1时刻的迭代输入量,y0为预设值,s0=h'n;步骤9:将s1…st…sm的值作为生成的回复语句进行输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910554079.5/,转载请声明来源钻瓜专利网。