[发明专利]基于神经网络的对话语义意图预测方法及学习训练方法在审
申请号: | 201810130549.0 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108363690A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 张宇 | 申请(专利权)人: | 北京十三科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/08 |
代理公司: | 北京正鼎专利代理事务所(普通合伙) 11495 | 代理人: | 岳亚 |
地址: | 100005 北京市东城*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于神经网络的聊天机器人对话语义意图预测方法以及学习训练方法,用于聊天机器人根据人类对话者的一个序列(已说过的)语句特征向量,预测出对话者可能延续的对话意图或兴趣点(多个之一),并通过启发性选择聊天机器人的输出对话以及将对话者的回话作为对之前意图预测结果的验证反馈,实现算法的在线强化学习和自我更新,利于不断提高对话意图预测的正确率,可延长聊天的轮数和增强对话者的兴趣。 | ||
搜索关键词: | 对话 意图预测 聊天机器人 语义 神经网络 学习训练 特征向量 在线强化 自我更新 兴趣点 正确率 轮数 算法 语句 验证 聊天 反馈 输出 预测 学习 | ||
【主权项】:
1.一种基于神经网络的对话语义意图预测方法,其特征在于,包括:输入向量生成模块设计:将人类对话者某个时间片段中一定长度的语句文本,根据词表进行向量空间表示,形成句子矩阵并作为Q‑LSTM神经网络模型的某一组输入;将某一个连续时间序列中的全部句子矩阵,按照顺序依次对应输入Q‑LSTM神经网络模型的Cell单元构成输入层;Q‑LSTM神经网络模块设计:基于长短期记忆LSTM神经网络实现Q学习算法模型,神经网络的输入为代表当前状态的一个人类对话者序列语句特征向量组,神经网络的输出为代表根据当前状态预测的一个人类对话者语义意图集合的概率分布向量;随机意图选择模块设计:根据所述Q‑LSTM神经网络算法模块,计算获得的当前时刻语义意图集合的概率分布向量;所述意图是对人类对话者后续话题的预测,将作为引导聊天机器人后续对话输出的依据;试探对话生成模块设计:根据随机选择判断的当前时刻意图,从预先设置的对话库中检索出对应该意图的试探性对话(实际行动),并通过聊天机器人系统将该对话传递给人类对话者;人类对话采集模块设计:利用文本或语音识别方法,将人类对话者回复聊天机器人试探性对话的信息传递回聊天机器人系统,并通过语义预处理转换为语句词特征向量;意图匹配检验模块设计:利用模板匹配特征分类方法,对人类对话者回复聊天机器人试探性对话的信息语句词特征向量进行计算,分辨出人类对聊天机器人输出试探性对话的回应结果;输入状态更新模块设计:当聊天机器人给出人类对话者意图预测,并输出试探性对话,进而对话者人类对话者回复聊天机器人试探性对话的信息语句词特征向量产生后,从Q学习模型角度,状态空间转移到了下一时刻,将当前时刻状态向量的每个句子矩阵由其依次由其后面的句子矩阵替代,并且其最后一个句子矩阵由对话者人类对话者回复聊天机器人试探性对话的信息语句词特征向量替代。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京十三科技有限公司,未经北京十三科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810130549.0/,转载请声明来源钻瓜专利网。