[发明专利]根据用户问句召回标准问句的方法和装置有效
申请号: | 201910635574.9 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110413750B | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 刘俊宏;温祖杰 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06N3/0464;G06N3/08 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 孙欣欣;周良玉 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 根据 用户 问句 召回 标准 方法 装置 | ||
本说明书实施例提供一种根据用户问句召回标准问句的方法和装置,方法包括:针对当前用户问句进行分词处理,得到所述当前用户问句对应的分词集合;将所述分词集合作为预先训练的第一卷积神经网络CNN模型的输入,通过所述第一CNN模型的输出得到所述当前用户问句的第一句子表示向量;获取根据预先训练的第二CNN模型生成的各标准问句对应的各第二句子表示向量;根据所述第一句子表示向量与各第二句子表示向量,确定召回的标准问句;其中,所述第一CNN模型、所述第二CNN模型作为深度结构语义模型DSSM模型中的特征提取器,通过对所述DSSM模型的训练而训练获得。能够高效地根据用户问句召回标准问句,并且召回的标准问句有较大概率符合用户述求。
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及根据用户问句召回标准问句的方法和装置。
背景技术
在客服机器人回答用户问题的场景下,针对用户问句倾向于口语化,无法明确用户述求的情况,可以根据用户问句从知识库中召回多个标准问句,由用户从上述多个标准问句中选择符合该用户述求的标准问句。
现有技术中,在根据用户问句召回标准问句时,常常存在时延大、以及召回的标准问句不满足用户述求的问题。
因此,希望能有改进的方案,能够高效地根据用户问句召回标准问句,并且召回的标准问句有较大概率符合用户述求。
发明内容
本说明书一个或多个实施例描述了一种根据用户问句召回标准问句的方法和装置,能够高效地根据用户问句召回标准问句,并且召回的标准问句有较大概率符合用户述求。
第一方面,提供了一种根据用户问句召回标准问句的方法,方法包括:
针对当前用户问句进行分词处理,得到所述当前用户问句对应的分词集合;
将所述分词集合作为预先训练的第一卷积神经网络(convolutional neuralnetwork,CNN)模型的输入,通过所述第一CNN模型的输出得到所述当前用户问句的第一句子表示向量;
获取根据预先训练的第二CNN模型生成的各标准问句对应的各第二句子表示向量;
根据所述第一句子表示向量与各第二句子表示向量,确定召回的标准问句;
其中,所述第一CNN模型、所述第二CNN模型作为深度结构语义模型(deepstructured semantic model,DSSM)模型中的特征提取器,通过对所述DSSM模型的训练而训练获得。
在一种可能的实施方式中,所述第一CNN模型或所述第二CNN模型采用如下至少一种滑动窗口:
一个分词的滑动窗口、两个分词的滑动窗口和三个分词的滑动窗口。
在一种可能的实施方式中,对所述DSSM模型进行训练的方式如下:
将历史用户问句对应的分词集合作为所述第一CNN模型的样本输入,将针对所述历史用户问句召回的历史标准问句作为所述第二CNN模型的样本输入,根据用户对历史标准问句的点击结果生成所述DSSM模型的样本标签,对所述DSSM模型进行训练。
在一种可能的实施方式中,所述根据所述第一句子表示向量与各第二句子表示向量,确定召回的标准问句,包括:
通过余弦相似度或欧式距离确定所述第一句子表示向量与各第二句子表示向量之间的相似度;
获取排序在前预定数目位的相似度对应的第二句子表示向量,将获取的第二句子表示向量对应的标准问句确定为召回的标准问句。
在一种可能的实施方式中,所述根据所述第一句子表示向量与各第二句子表示向量,确定召回的标准问句,包括:
获取与所述第一句子表示向量距离最接近的预设数目个第二句子表示向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910635574.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:确定标准问题的方法及装置
- 下一篇:药品搜索方法、装置、终端设备以及存储介质