[发明专利]模型训练方法、对话生成方法和装置、设备及存储介质在审

申请号：	202210532361.5	申请日：	2022-05-11
公开（公告）号：	CN114936274A	公开（公告）日：	2022-08-23
发明（设计）人：	司世景;王健宗;叶童	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G06F16/332	分类号：	G06F16/332;G06F40/289;G06N3/08
代理公司：	广州嘉权专利商标事务所有限公司 44205	代理人：	廖慧贤
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	模型训练方法对话生成装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例提供了一种模型训练方法、对话生成方法和装置、设备及存储介质，属于人工智能技术领域。该方法包括：获取样本数据，其中，样本数据包括样本问题和候选答案；对样本数据进行分词处理，得到多个样本问答对；将样本问答对输入至预设的神经网络模型中，其中，神经网络模型包括编码层和高斯过程层；通过编码层对样本问答对进行特征提取，得到样本表征向量；通过高斯过程层对预设变量和样本表征向量进行对话预测，得到样本预测概率；根据样本预测概率对神经网络模型的损失函数进行优化，得到对话生成模型，其中，对话生成模型用于根据输入的目标问题生成目标回复答案。本申请实施例能够提高模型的训练效果。

技术领域

本申请涉及人工智能技术领域，尤其涉及一种模型训练方法、对话生成方法和装置、设备及存储介质。

背景技术

目前，对话生成方法常常是通过深度神经网络模型对上下文语义与候选答案之间的关系进行提取，从而寻找最佳的候选答案，由于深度神经网络模型存在着过拟合的问题，常常需要进行模型校准，而常用的校准方式往往校准效果较差，影响模型的训练效果，因此，如何提高模型的训练效果，成为了亟待解决的技术问题。

发明内容

本申请实施例的主要目的在于提出一种模型训练方法、对话生成方法和装置、设备及存储介质，旨在提高模型的训练效果。

为实现上述目的，本申请实施例的第一方面提出了一种模型训练方法，所述方法包括：

获取样本数据，其中，所述样本数据包括样本问题和候选答案；

对所述样本数据进行分词处理，得到多个样本问答对；

将所述样本问答对输入至预设的神经网络模型中，其中，所述神经网络模型包括编码层和高斯过程层；

通过所述编码层对所述样本问答对进行特征提取，得到样本表征向量；

通过所述高斯过程层对预设变量和所述样本表征向量进行对话预测，得到样本预测概率；