[发明专利]一种人机对话方法及系统在审
申请号: | 202110200723.6 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112883179A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 陈欢欢;范祖宁 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/289;G06F40/216;G06F40/126;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘乐 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 人机对话 方法 系统 | ||
1.一种人机对话方法,其特征在于,包括:
获取当前对话语句;
对所述当前对话语句进行预处理,得到词向量序列;
将所述词向量序列输入至预先训练的句子分类模型,得到所述当前对话语句的句子功能标签,所述句子分类模型为以对话语句的词向量序列作为训练样本,以句子功能标签作为标签训练得到,其中,训练所述句子分类模型的句子功能标签中的疑问句比例在预设比例区间内;
将所述词向量序列和所述句子功能标签输入至预先训练的生成式对话模型,采用生成式对话方法输出所述当前对话语句的回答语句,其中,所述生成式对话模型在训练过程中采用反向传播算法进行学习,且损失函数收敛为最小值,所述损失函数用于表征所述生成式对话模型输出的回答语句的分类概率相对于参考回答语句的分类概率的损失情况。
2.根据权利要求1所述的人机对话方法,其特征在于,所述对所述当前对话语句进行预处理,得到词向量序列,具体包括:
对所述当前对话语句进行分词得到单词序列;
对所述单词序列中的每个单词进行词嵌入处理,将每个所述单词转换为词向量,得到所述词向量序列。
3.根据权利要求1所述的人机对话方法,其特征在于,所述将所述词向量序列和所述句子功能标签输入至预先训练的生成式对话模型,采用生成式对话方法输出所述当前对话语句的回答语句,具体包括:
使用编码器对所述词向量序列进行进行编码得到隐状态;
使用解码器对所述隐状态进行解码得到输出序列,当所述输出序列的最后一个字符为停止符时停止解码;
将解码得到的所述输出序列和所述句子功能标签输入至所述生成式对话模型,采用生成式对话方法输出所述当前对话语句的所述回答语句。
4.根据权利要求3所述的人机对话方法,其特征在于,所述隐状态的表达式如下:
ht=f(xt,ht-1);c=ht;
式中,ht为所述隐状态,f为激活函数,所述激活函数为非线性函数,xt为第t个所述词向量序列中的词向量,ht-1为t-1时刻所对应的词向量序列的上下文向量,c为上下文向量。
5.根据权利要求1所述的人机对话方法,其特征在于,所述损失函数为输出语句损失因子和分类损失因子的加权平均,所述损失函数的表达式如下:
式中,loss为所述损失函数,α和β表示加权平均的权重,α和β均在0和1之间取值,且α+β=1;
其中,所述输出语句损失因子的表达式如下:
式中,lossA表示所述输出语句损失因子,n表示当前对话语句的总长度,i表示求和过程中的自变量,代表回答语句生成过程中当前对话语句长度,P表示由第1个单词到第n-1个单词,生成第n个单词的概率,yn表示回答语句中的第n个单词,y1表示回答语句中的第1个单词,yn-1表示回答语句中的第n-1个单词;
所述分类损失因子的表达式如下:
式中,k表示句子功能类别,i表示求和过程中的变量,取值为1~k,Y表示所述回答语句所对应的分类标签,U表示参考回答V所对应的分类标签,P(Y|k)表示所述回答语句取得分类标签Y的概率,P(U|k)表示生成式对话模型输出参考回答V取得分类标签U的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110200723.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:钣金件直缝焊接和打磨装置及其方法
- 下一篇:一种调光膜及其制备方法