[发明专利]一种开放域对话回复自动生成方法、系统及存储介质在审
申请号: | 202010459288.4 | 申请日: | 2020-05-27 |
公开(公告)号: | CN111753068A | 公开(公告)日: | 2020-10-09 |
发明(设计)人: | 高望;朱珣;邓宏涛;刘哲;王煜炜 | 申请(专利权)人: | 江汉大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/284;G06F40/126 |
代理公司: | 武汉智嘉联合知识产权代理事务所(普通合伙) 42231 | 代理人: | 黄君军 |
地址: | 430056 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 开放 对话 回复 自动 生成 方法 系统 存储 介质 | ||
1.一种开放域对话回复自动生成方法,其特征在于,包括如下步骤:
S1,提供一对话语料数据集,对所述对话语料数据集进行预处理,得到用户问句;
S2,依据TBERT模型对所述用户问句进行编码处理,生成主题向量,所述主题向量经函数处理得到主题词;
S3,将所述主题词引入到开放域对话系统模型中,生成回复信息。
2.根据权利要求1所述的开放域对话回复自动生成方法,其特征在于,所述S1中所述预处理具体包括:
将所有字母转变为小写字母;
过滤掉非拉丁字符和停用词;
过滤掉出现次数小于预设次数的词。
3.根据权利要求1所述的开放域对话回复自动生成方法,其特征在于,所述S2具体包括以下步骤:
S21,依据TBERT模型对所述用户问句进行向量化处理,得到字符向量;
S22,依据TBERT模型的自注意力机制及多头注意力机制对所述字符向量进行编码处理,得到所述字符向量的隐藏状态;
S23,将所述字符向量的隐藏状态的第一个字符作为问句向量,所述问句向量通过主题输入矩阵和主题输出矩阵处理得到主题向量;
S24,将所述主题向量通过函数处理来预测用户问句中的每个词,得到用户问句对应的主题词。
4.根据权利要求1所述的开放域对话回复自动生成方法,其特征在于,所述S3中的所述开放域对话系统模型包括编码器及解码器,所述编码器与所述解码器由两个带门控循环单元的循环神经网络组成。
5.根据权利要求4所述的开放域对话回复自动生成方法,其特征在于,所述S3具体包括以下步骤:
S31,将所述主题词引入到开放域对话系统模型中,所述编码器通过双向GRU将所述用户问句编码呈隐藏状态;
S32,所述门控单元将所述主题向量引入所述隐藏状态的用户问句中生成语料词汇表;
S33,所述语料词汇表与所述主题词组成的主题词表在联合生成单元中提供回复词,所述回复词经解码器解码生成回复。
6.根据权利要求3所述的开放域对话回复自动生成方法,其特征在于,所述S22中将字符向量编码为隐藏状态的公式为:
MultiHead(Q,K,V)=Concat(head1,head2,...,headh)WO
headi=Attention(QWiQ,KWiK,VWiV) (2)
其中,Q、K和V分别表示为查询、键和值,softmax表示逻辑回归函数,Concat表示连接操作,表示参数矩阵,在TBERT模型中,多头注意力层数h=12,dk=dv=dmodel/h=64。
7.根据权利要求3所述的开放域对话回复自动生成方法,其特征在于,所述S23中所述问句向量转化为所述主题向量的公式为:
Va=softmax(IVq) (3)
Vt=OTVa (4)
其中,Va表示为注意力分布,I表示为主题输入矩阵,Vq表示为问句向量,Vt表示为主题向量,O表示为主题输出矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江汉大学,未经江汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010459288.4/1.html,转载请声明来源钻瓜专利网。