[发明专利]一种个性化对话的回复生成方法有效
| 申请号: | 201911270617.4 | 申请日: | 2019-12-12 |
| 公开(公告)号: | CN111159368B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 蔡毅;黎伟钊 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/951;G06N3/006 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 裴磊磊 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 个性化 对话 回复 生成 方法 | ||
1.一种个性化对话的回复生成方法,其特征在于,包括步骤:
收集具有人物个性信息的对话语料数据;
对收集的数据进行预处理;
采用对话上下文以及预处理后的数据作为输入数据对模型进行训练,具体为:
根据对话上下文,提取关于对话历史的信息;
根据人物个性信息,计算人物交互表示向量,具体为:
将人物表示序列中各个词语转换成词向量形式,再使用GRU作为编码器对其进行编码得到关于人物个性表示序列的隐层表示向量序列
在将人物个性的各个值进行编码后,使用注意力机制,将上述隐层表示向量序列中的各个向量合并为单一向量,即给定上一时刻的解码器中的隐状态,计算出各个个性隐层表示向量的权重,以加权平均的方式得到人物表示向量vp,人物表示向量vp计算方法为:
其中,和为可训练的参数,计算出来的权重αi′表示当前时刻对应人物个性对回复的影响;
对于说话人A以及聆听者B,分别计算其各自的人物个性表示向量,记为和通过线性相加与激活函数处理得到关于说话人A对于B的人物交互表示向量:
其中,W1和W2为可训练的参数;VA,B同时依赖于对话中的说话人A和聆听者B的个性信息;
输出各个时刻词语生成的概率分布,具体为:
解码器中的隐状态向量记为st,则计算当前时刻的生成词语yt的概率分布的相关计算公式为:
其中,VT和bout为可训练的参数;at为一个标量,其值为0到1之间;
根据总体词语生成概率来计算模型的损失函数,具体为:
模型通过最小化整个序列上的负对数似然损失函数来优化模型网络参数,损失函数表示为:
其中,x表示的是用户输入的语句,T表示的是说话人自身的人物个性信息,T′表示的是对方的人物个性信息,y是模型输出的结果;在训练过程中,模型根据损失函数得到的损失进行梯度反向传播,从而调整网络参数;当完成一个轮次的训练之后,模型会在验证集上计算损失;当训练轮数达到最大轮数,或者验证集上的损失,在连续3个轮次中都没有下降,则模型停止训练;
将对话上下文和人物个性信息输入训练后模型,生成新的回复,具体为:
利用回复生成模型,确定各个时刻对应的词语概率分布;
利用束搜索技术,生成回复句子序列;
利用预先定义好的规则,对模型生成的初始回复进行合理性的修改。
3.根据权利要求1所述的方法,其特征在于,所述对收集数据进行预处理的步骤中,包括:
对收集得到的数据进行数据过滤;
在经过数据过滤后,对原始数据进行序列化处理。
4.根据权利要求3所述的方法,其特征在于,所述过滤数据的处理包括:人名地名替换、筛选去除单轮语句长度过小或者过大的数据、筛选去除单轮语句低频词数量过多的数据。
5.根据权利要求3所述的方法,其特征在于,所述对数据进行序列化操作,包括:
将非根节点的评论看作为回复,根节点到该评论之前的评论语句拼接起来作为对话上下文;根节点指代用户初始发布的消息;每一个评论消息和其之前的语句都能组成一个对话;
人物个性信息以键值对存储,将人物个性值抽取出来并组合为人物表示序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911270617.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于公安文本的主动发现案件关键词的方法
- 下一篇:设备测试方法及系统





