[发明专利]一种个性化对话的回复生成方法有效

申请号：	201911270617.4	申请日：	2019-12-12
公开（公告）号：	CN111159368B	公开（公告）日：	2023-04-28
发明（设计）人：	蔡毅;黎伟钊	申请（专利权）人：	华南理工大学
主分类号：	G06F16/332	分类号：	G06F16/332;G06F16/951;G06N3/006
代理公司：	广州市华学知识产权代理有限公司 44245	代理人：	裴磊磊
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种个性化对话回复生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种个性化对话的回复生成方法，其特征在于，包括步骤：

收集具有人物个性信息的对话语料数据；

对收集的数据进行预处理；

采用对话上下文以及预处理后的数据作为输入数据对模型进行训练，具体为：

根据对话上下文，提取关于对话历史的信息；

根据人物个性信息，计算人物交互表示向量，具体为：

将人物表示序列中各个词语转换成词向量形式，再使用GRU作为编码器对其进行编码得到关于人物个性表示序列的隐层表示向量序列

在将人物个性的各个值进行编码后，使用注意力机制，将上述隐层表示向量序列中的各个向量合并为单一向量，即给定上一时刻的解码器中的隐状态，计算出各个个性隐层表示向量的权重，以加权平均的方式得到人物表示向量v_p，人物表示向量v_p计算方法为：

其中，和为可训练的参数，计算出来的权重α_i′表示当前时刻对应人物个性对回复的影响；

对于说话人A以及聆听者B，分别计算其各自的人物个性表示向量，记为和通过线性相加与激活函数处理得到关于说话人A对于B的人物交互表示向量：

其中，W₁和W₂为可训练的参数；V_A,B同时依赖于对话中的说话人A和聆听者B的个性信息；

输出各个时刻词语生成的概率分布，具体为：

解码器中的隐状态向量记为s_t，则计算当前时刻的生成词语y_t的概率分布的相关计算公式为：

其中，V^T和b_out为可训练的参数；a_t为一个标量，其值为0到1之间；

根据总体词语生成概率来计算模型的损失函数，具体为：

模型通过最小化整个序列上的负对数似然损失函数来优化模型网络参数，损失函数表示为：

其中，x表示的是用户输入的语句，T表示的是说话人自身的人物个性信息，T′表示的是对方的人物个性信息，y是模型输出的结果；在训练过程中，模型根据损失函数得到的损失进行梯度反向传播，从而调整网络参数；当完成一个轮次的训练之后，模型会在验证集上计算损失；当训练轮数达到最大轮数，或者验证集上的损失，在连续3个轮次中都没有下降，则模型停止训练；

将对话上下文和人物个性信息输入训练后模型，生成新的回复，具体为：

利用回复生成模型，确定各个时刻对应的词语概率分布；

利用束搜索技术，生成回复句子序列；

利用预先定义好的规则，对模型生成的初始回复进行合理性的修改。

2.根据权利要求1所述的方法，其特征在于，所述收集具有人物个性信息的对话语料数据的步骤中，包括：

利用爬虫技术，从社交网站上爬真实的对话记录；

爬取语句对应的人物个性值，存储为键值对形式。

3.根据权利要求1所述的方法，其特征在于，所述对收集数据进行预处理的步骤中，包括：

对收集得到的数据进行数据过滤；

在经过数据过滤后，对原始数据进行序列化处理。

4.根据权利要求3所述的方法，其特征在于，所述过滤数据的处理包括：人名地名替换、筛选去除单轮语句长度过小或者过大的数据、筛选去除单轮语句低频词数量过多的数据。

5.根据权利要求3所述的方法，其特征在于，所述对数据进行序列化操作，包括：