[发明专利]一种面向推荐的情绪型对话方法在审
申请号: | 202111262140.2 | 申请日: | 2021-10-28 |
公开(公告)号: | CN114168707A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 黄家栋;谢志峰 | 申请(专利权)人: | 上海大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F16/36;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 推荐 情绪 对话 方法 | ||
1.一种面向推荐的情绪型对话方法,实现在不干扰推荐内容的前提下,生成符合用户当前情绪的对话回复;其特征在于,具体操作步骤如下:
(1)对话数据集的预处理:通过训练情绪文本分类模型,预测对话数据集中历史对话与回复句的情绪标签值,将情绪预测标签结果保留在数据集中;
(2)预测推荐内容模型训练:根据数据集中的推荐目标序列以及历史对话信息,通过用户画像中用户喜好对最终推荐目标序列的干预,训练并预测当前目标是否完成以及下一个推荐的目标实体,得到最终的推荐目标序列;
(3)情绪型对话模型训练:基于Sequence-to-Sequence模型,将知识模块、推荐目标序列模块、历史对话模块、当前回复模块等作为Encoder,在Decoder处加入情绪嵌入模块,进行训练;在不干扰知识输出的前提下,完成对用户情绪的捕获并以此改善对话回复;
(4)面向推荐的情绪型对话模型调用:通过调用上述训练模型,首先根据用户画像预测最终的推荐目标序列,再预测当前输入语句的情感标签值,加上历史对话作为上下文输入,通过Sequence-to-Sequence编解码,得到最终的对话回复输出。
2.根据权利要求1所述的面向推荐的情绪型对话方法,其特征在于,所述步骤(1)通过级联ERNIE与TextCNN模块,构建情绪文本分类网络,文本分类训练数据集中包含喜欢like、悲伤sad、愤怒anger、厌恶disgust、高兴happiness、其他null六类情绪文本语料;该文本分类网络模型的损失函数为在预测值与真实值之间做交叉熵:
其中n为样本数,q为输出类别数,是真实值向量y(i)中非0即1的元素,是预测值向量中非0即1的元素;i表示第i个样本;j表示第j个分类类别;
训练后得到分类模型,应用于百度开源的DuRecDial数据集,并将该数据集中的历史对话及对应回复,通过该文本分类网络模型进行情绪预测,得到每句对应的情绪预测标签值,将预测结果保留在数据集中,同时,数据集中保留历史对话、当前回复、三元组形式的知识图谱信息、推荐目标序列、用户画像字段。
3.根据权利要求1所述的面向推荐的情绪型对话方法,其特征在于,所述步骤(2)基于DuRecDial数据集中的推荐目标序列以及用户画像字段,构建推荐目标预测网络,该网络包含两个模块:判断当前目标完成情况模块以及预测下一个推荐实体模块;其中,判断当前目标完成情况模块采用的网络模型为TextCNN,将历史对话和当前对话进展情况作为输入,输出为预测当前目标完成的概率:
PGC(l=1|X,gt-1) (2)
其中,X表示历史对话,t表示当前对话轮次,gt-1表示上一句话的对话目标,PGC表示目标完成概率;若概率值小于0.5,表示未完成,则将上一句对话目标返回作为下一轮对话目标;若概率值大于0.5,表示当前对话目标已完成,则进入下一阶段,即下一个推荐目标预测;
预测下一个推荐实体模块采用了基于CNN的多分类网络,同时根据用户画像中用户的喜好,在该网络中加入对应的Attention机制,对应用户喜好的推荐目标将会被分配更高的权重值;通过该Attention对最终推荐目标序列的干预,训练并预测当前目标是否完成,并预测下一个对话的目标实体,得到最终的推荐目标序列;其概率模型写为:
其中,P为用户画像,代表用户的喜好与厌恶,X为历史对话,G原始推荐目标,gtp为下一个候选对话推荐目标,PGP表示对话目标预测概率,t表示当前对话轮次。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111262140.2/1.html,转载请声明来源钻瓜专利网。