[发明专利]基于信息增强的对话状态跟踪方法、系统、装置有效
| 申请号: | 201911276031.9 | 申请日: | 2019-12-12 |
| 公开(公告)号: | CN111061850B | 公开(公告)日: | 2023-04-28 |
| 发明(设计)人: | 赵军;何世柱;刘康;刘庆斌 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F18/232;G06F18/2411;G06F18/214 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 信息 增强 对话 状态 跟踪 方法 系统 装置 | ||
1.一种基于信息增强的对话状态跟踪方法,其特征在于,该方法包括:
基于用户t时刻的对话文本,通过对话状态跟踪模型得到t时刻的对话状态;t时刻的对话状态包括一或多个槽值对及对应的概率;所述槽值对包括槽、槽值;
所述对话状态跟踪模型基于编码器-解码器架构的神经网络构建;
所述对话状态跟踪模型包括对话话语编码器、上一步对话状态编码器、已知值编码器、当前对话状态解码器;
所述对话话语编码器用于基于用户t时刻的对话文本、t-1时刻系统回复用户的对话文本,通过Glove词嵌入方法、n-gram词嵌入方法进行词向量拼接,将拼接后的词向量序列通过双向长短记忆网络得到对话话语编码表示;
所述上一步对话状态编码器用于将t-1时刻对话状态中的槽值对进行拼接,将拼接后的序列通过双向长短记忆网络得到上一步对话状态编码表示;
所述已知值编码器用于将预定义状态库各槽值对中的槽值进行拼接,将拼接后的序列通过双向长短记忆网络得到已知槽值编码表示;
所述当前对话状态解码器用于基于所述对话话语编码表示和所述上一步对话状态编码表示拼接成的对话历史表示、当前对话状态各槽值对中的槽,通过双向长短记忆网络进行解码得到t时刻的对话状态;
所述对话状态跟踪模型其训练方法为:
步骤A100,基于已标注的对话集获取用户t时刻的对话文本,通过预设的语义关联度评估方法获取所述对话文本中每个词与预定义状态库中各槽值对的槽、槽值的语义关联度;
步骤A200,基于所述用户t时刻的对话文本、t-1时刻的对话状态、所述语义关联度,通过对话状态跟踪模型得到t时刻的对话状态;计算所述对话状态跟踪模型的损失值,更新其参数;
步骤A300,令t=t+1,循环执行步骤A100-A200的方法,直至本次对话结束;
步骤A400,基于所有时刻对应的对话状态,通过预设的语义聚类方法得到聚类后的对话状态,将其增入所述预定义状态库;
步骤A500,采用步骤A100-A200的方法,更新所有时刻的对话状态,并计算所述对话状态跟踪模型的损失值,更新其参数,得到训练好的对话状态跟踪模型。
2.根据权利要求1所述的基于信息增强的对话状态跟踪方法,其特征在于,所述预设的语义关联度评估方法包括中心关联度评估方法、周边关联度评估方法;
所述中心关联度评估方法通过求取所述对话文本中每个词与各槽值对中槽的词向量的余弦相似度获取语义关联度;
所述周边关联度评估方法通过求取所述对话文本中每个词与各槽值对中槽值的余弦相似度获取语义关联度。
3.根据权利要求1所述的基于信息增强的对话状态跟踪方法,其特征在于,“通过Glove词嵌入方法、n-gram词嵌入方法进行词向量拼接”,其方法为:
基于用户t时刻的对话文本、t-1时刻系统回复用户的对话文本,分别通过Glove词嵌入方法和n-gram词嵌入方法获取其对应的词向量并进行拼接,得到用户对话词向量序列、系统回复词向量序列;
将所述用户对话词向量序列、所述系统回复词向量序列进行拼接。
4.根据权利要求1所述的基于信息增强的对话状态跟踪方法,其特征在于,步骤A200中“通过对话状态跟踪模型得到t时刻的对话状态”其方法为:
获取t时刻的对话状态中各槽值对的概率,若所述槽值对中槽、槽值为一一对应的关系,则选取概率最高且概率大于预设概率阈值对应的已知值作为槽值;所述已知值为预定义状态库中的槽值;
若所述槽值对中槽、槽值为一对多的关系,则选取概率大于预设概率阈值对应的多个已知值作为该槽对应的槽值;
否则,根据预设的奖励规则,获取所述对话历史表示中各词的奖励值;将奖励值和所述对话状态中槽、槽值为一对多的槽值对对应的概率相乘,将相乘后概率值最高的词作为对话状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911276031.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于移动终端的智能3D采集模组
- 下一篇:一种高精度3D信息采集的设备及方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





