[发明专利]一种基于向量检索的对话应答方法、装置和系统在审
| 申请号: | 202011192950.0 | 申请日: | 2020-10-30 |
| 公开(公告)号: | CN112100360A | 公开(公告)日: | 2020-12-18 |
| 发明(设计)人: | 刘志敏;田刚 | 申请(专利权)人: | 北京淇瑀信息科技有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F16/31;G06N3/04 |
| 代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
| 地址: | 100012 北京市朝阳*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 向量 检索 对话 应答 方法 装置 系统 | ||
本发明公开了一种基于向量检索的对话应答方法、装置和系统,其中方法包括:汇总智能机器人应答的对话主题,计算所述对话主题的向量,构建树形结构的对话主题数据库,直至所述树形结构的叶子节点内的对话主题数量少于N,N为自然数;获取用户的输入内容,计算所述输入内容的向量,基于所述输入内容的向量,匹配最接近的对话主题;根据匹配到的对话主题选取相应的语料与用户进行对话。采用该技术方案,计算用户输入的向量,基于获得的向量进行检索和匹配,能够快速而且准确的找到需要要的对话主题,使用对话主题对应的语料与用户进行沟通。减少了用户的等待时间,提高了准确度,更好的提升了用户的感受。
技术领域
本发明涉及计算机信息处理领域,具体而言,涉及一种基于向量检索的对话应答方法、装置和系统。
背景技术
客户服务中心是企业与用户沟通的主要桥梁,提升用户满意度的主要渠道。以前客户服务中心主要以人工客服为主,由专业的客服人员为用户进行服务。
随着计算机信息处理技术的发展,越来越多的客户服务中心开始采用智能语音机器人来为用户进行服务,缓解人工客服等待时间过长的问题。
目前使用智能语音机器人与用户进行对话的方法是通过用户输入内容的关键词进行检索,匹配最接近的对话主题,使用匹配到的对话主题对应的语料与用户进行沟通。而现在使用智能语音机器人处理的内容越来越多,对话主题库越来越庞大,通过关键词进行检索存在检索时间长,检索获得的对话主题不准确的问题。
发明内容
本发明旨在解决现有智能语音机器人通过关键词检索对话主题检索时间长,检索获得的对话主题不准确的问题。
为了解决上述技术问题,本发明第一方面提出一种基于向量检索的对话应答方法,方法包括:
汇总智能机器人应答的对话主题,计算所述对话主题的向量,基于所述对话主题的向量值构建树形结构的对话主题数据库,直至所述树形结构的叶子节点内的对话主题数量少于N,所述对话主题数据库中存储有对话主题以及所述对话主题对应的语料,N为自然数;
获取用户的输入内容,计算所述输入内容的向量,基于所述输入内容的向量,匹配最接近的对话主题;
根据匹配到的对话主题选取相应的语料与用户进行对话。
根据本发明的一种优选实施方式,所述树形结构具体为二叉树树形结构。
根据本发明的一种优选实施方式,基于所述对话主题的向量值构建树形结构的对话主题数据库具体为:
将汇总的智能机器人应答的对话主题作为根节点,将所述汇总的对话主题的向量输入分类模型进行分类,分类后的对话主题构成结点;
将结点所包含的对话主题的向量输入分类模型进行分类,获得下一层新结点;
重复上述步骤,直至获得的下一层新结点所包含的对话主题数量少于N。
根据本发明的一种优选实施方式,基于所述输入内容的向量,匹配最接近的对话主题具体为:
根据所述输入内容的向量,检索到最接近的结点;
将所述输入内容以及所述最接近的结点所包含的对话主题输入主题匹配模型,匹配最接近的对话主题。
根据本发明的一种优选实施方式,所述主题匹配模型包括编码层和匹配层,所述编码层用于将输入的句子转化为句向量,所述匹配层用于句向量之间的匹配计算。
根据本发明的一种优选实施方式,所述编码层采用双向长短时期记忆网络模型。
根据本发明的一种优选实施方式,所述匹配层采用余弦算法计算用户问句的句向量与标准问句的句向量之间的匹配度。
本发明第二方面提出一种基于向量检索的对话应答装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司,未经北京淇瑀信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011192950.0/2.html,转载请声明来源钻瓜专利网。





