[发明专利]基于知识库的对话生成方法、装置、终端及存储介质在审
| 申请号: | 202110123123.4 | 申请日: | 2021-01-29 |
| 公开(公告)号: | CN112818098A | 公开(公告)日: | 2021-05-18 |
| 发明(设计)人: | 孙思 | 申请(专利权)人: | 平安国际智慧城市科技股份有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06N3/04;G06N3/08;G06Q30/02 |
| 代理公司: | 深圳国新南方知识产权代理有限公司 44374 | 代理人: | 周雷 |
| 地址: | 518000 广东省深圳市前海深港合*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识库 对话 生成 方法 装置 终端 存储 介质 | ||
1.一种基于知识库的对话生成方法,其特征在于,包括:
获取用户输入数据、预设知识库的三元组数据以及预设的占位符集,利用所述用户输入数据、所述三元组数据和所述占位符集构建所述模型输入数据,并将所述模型输入数据向量化,得到初始语义向量;
将所述初始语义向量输入至预先训练好的对话网络模型的编码端,利用所述编码端对所述初始语义向量进行编码,得到隐状态,再利用所述隐状态、所述对话网络模型中的记忆矩阵对所述初始语义向量进行更新,得到最终语义向量;
利用所述最终语义向量取出最终关注内容并输出至所述对话网络模型的解码端;
利用所述解码端对所述最终关注内容解码得到词分布,通过所述词分布输出初始解码结果;
当所述初始解码结果中存在占位符时,通过所述最终语义向量与所述知识库做指针网络,得到局部记忆指针,再通过所述局部记忆指针的分布得到分布最大的目标数据作为输出,利用所述目标数据替换所述占位符,得到最终解码结果;
根据所述最终解码结果对所述用户的输入进行回复。
2.根据权利要求1所述的方法,其特征在于,所述将所述初始语义向量输入至预先训练好的对话网络模型的编码端,利用所述编码端对所述初始语义向量进行编码,得到隐状态,再利用所述隐状态、所述对话网络模型中的记忆矩阵对所述初始语义向量进行更新,得到最终语义向量,包括:
将所述初始语义向量输入至所述编码端进行编码,得到隐状态;
将所述隐状态添加至所述记忆矩阵中,得到更新后的记忆矩阵;
利用所述更新后的记忆矩阵和所述初始语义向量计算得到从所述初始语义向量中取出的关注内容;
利用所述关注内容更新所述初始语义向量,得到更新后的语义向量,并对所述更新后的语义向量再次进行编码;
重复执行上述步骤,直至达到预设次数为止,得到所述最终语义向量。
3.根据权利要求1所述的方法,其特征在于,所述利用所述最终语义向量取出最终关注内容并输出至所述对话网络模型的解码端之后,还包括:
通过所述最终语义向量查询所述知识库,得到记忆分布的全局记忆指针;
所述最终语义向量与所述知识库做指针网络,得到局部记忆指针,包括:
通过所述全局记忆指针从所述知识库中筛选出目标数据集,再通过所述最终语义向量与所述目标数据集做指针网络,得到所述局部记忆指针。
4.根据权利要求3所述的方法,其特征在于,所述通过所述最终语义向量查询所述知识库,得到记忆分布的全局记忆指针,包括:
通过所述最终语义向量查询所述知识库中的每一条数据,再利用所述最终语义向量和所述记忆矩阵做内积相似度计算,并对计算结果执行sigmoid函数,得到记忆分布的所述全局记忆指针。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括预先训练所述对话网络模型,包括:
获取样本训练数据,所述样本训练数据包括样本输入和样本真实结果,将所述样本输入向量化,得到初始样本语义向量,所述样本输入包括历史对话数据、所述知识库的三元组数据和所述占位符集,所述样本真实结果包括每个词的指向位置;
将所述初始样本语义向量输入至待训练的对话网络模型的编码端,利用所述编码端对所述初始样本语义向量进行编码,得到样本隐状态,再利用所述样本隐状态、所述对话网络模型中的记忆矩阵对所述初始样本语义向量进行更新,得到最终样本语义向量;
利用所述最终样本语义向量取出最终样本关注内容并输出至所述对话网络模型的解码端;
利用所述解码端对所述最终样本关注内容解码得到样本词分布,通过所述样本词分布输出初始样本解码结果,并基于所述初始样本解码结果和预设的第一损失函数计算第一损失函数值;
当所述初始样本解码结果中存在所述占位符时,通过所述最终样本语义向量与所述知识库做指针网络,得到样本局部记忆指针,再通过所述样本局部记忆指针得到概率最大的目标样本数据作为输出,利用所述目标样本数据替换所述占位符,得到最终样本解码结果,再基于所述样本词分布、所述每个词的指向位置、所述样本局部记忆指针和预设的第二损失函数计算第二损失函数值;
通过所述第一损失函数值和所述第二损失函数值反向传播更新所述对话网络模型直至达到预设要求。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安国际智慧城市科技股份有限公司,未经平安国际智慧城市科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110123123.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于压电效应发电的坐垫
- 下一篇:一种冲压件检具底座结构





