[发明专利]基于神经网络的对话语义意图预测方法及学习训练方法在审
申请号: | 201810130549.0 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108363690A | 公开(公告)日: | 2018-08-03 |
发明(设计)人: | 张宇 | 申请(专利权)人: | 北京十三科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/30;G06N3/08 |
代理公司: | 北京正鼎专利代理事务所(普通合伙) 11495 | 代理人: | 岳亚 |
地址: | 100005 北京市东城*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 意图预测 聊天机器人 语义 神经网络 学习训练 特征向量 在线强化 自我更新 兴趣点 正确率 轮数 算法 语句 验证 聊天 反馈 输出 预测 学习 | ||
1.一种基于神经网络的对话语义意图预测方法,其特征在于,包括:
输入向量生成模块设计:将人类对话者某个时间片段中一定长度的语句文本,根据词表进行向量空间表示,形成句子矩阵并作为Q-LSTM神经网络模型的某一组输入;将某一个连续时间序列中的全部句子矩阵,按照顺序依次对应输入Q-LSTM神经网络模型的Cell单元构成输入层;
Q-LSTM神经网络模块设计:基于长短期记忆LSTM神经网络实现Q学习算法模型,神经网络的输入为代表当前状态的一个人类对话者序列语句特征向量组,神经网络的输出为代表根据当前状态预测的一个人类对话者语义意图集合的概率分布向量;
随机意图选择模块设计:根据所述Q-LSTM神经网络算法模块,计算获得的当前时刻语义意图集合的概率分布向量;所述意图是对人类对话者后续话题的预测,将作为引导聊天机器人后续对话输出的依据;
试探对话生成模块设计:根据随机选择判断的当前时刻意图,从预先设置的对话库中检索出对应该意图的试探性对话(实际行动),并通过聊天机器人系统将该对话传递给人类对话者;
人类对话采集模块设计:利用文本或语音识别方法,将人类对话者回复聊天机器人试探性对话的信息传递回聊天机器人系统,并通过语义预处理转换为语句词特征向量;
意图匹配检验模块设计:利用模板匹配特征分类方法,对人类对话者回复聊天机器人试探性对话的信息语句词特征向量进行计算,分辨出人类对聊天机器人输出试探性对话的回应结果;
输入状态更新模块设计:当聊天机器人给出人类对话者意图预测,并输出试探性对话,进而对话者人类对话者回复聊天机器人试探性对话的信息语句词特征向量产生后,从Q学习模型角度,状态空间转移到了下一时刻,将当前时刻状态向量的每个句子矩阵由其依次由其后面的句子矩阵替代,并且其最后一个句子矩阵由对话者人类对话者回复聊天机器人试探性对话的信息语句词特征向量替代。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
所述输入层取某一个连续时间序列语句特征的作为当前时刻的输入,按照顺序依次送入到LSTM神经网络模型对应的Cell中,以保证聊天文本的时序性。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
由一系列重复的Cell单元组成长短期记忆层,每个Cell单元接收上一时刻隐层的输出以及当前时刻的输入;每一个Cell单元由输入门、遗忘门和输出门组成,长短期记忆层神经网络,采用反向传播算法实现学习训练。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
分类输出层为多个人类对话者语义意图的概率分布向量,所述向量由Q-LSTM神经网络模型输出经Softmax函数计算获得。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
将每个语义意图当作一个虚拟行动,所述语义意图的概率转意为对应当前状态的动作值;采用瞬时差分算法实现Q-LSTM神经网络的强化学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京十三科技有限公司,未经北京十三科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810130549.0/1.html,转载请声明来源钻瓜专利网。