[发明专利]智能客服场景中的知识点召回方法及装置有效
申请号: | 202010302538.3 | 申请日: | 2020-04-17 |
公开(公告)号: | CN111461753B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 杨明晖;刘佳;王子豪;崔恒斌 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F16/35;G06F16/332 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 张明;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 客服 场景 中的 知识点 召回 方法 装置 | ||
1.一种智能客服场景中的知识点召回方法,包括:
获取分层可导航小世界图HNSW,所述HNSW包括上下排列的多层NSW;所述多层NSW的相邻两层NSW中,上一层NSW所包含的节点为下一层NSW所包含的节点的子集;所述多层NSW的最下层NSW包含N个节点;其中的每个节点代表一个知识点类簇的类簇中心并对应于一个中心向量;所述中心向量基于归属于对应知识点类簇的各知识点标题的句子向量确定;所述多层NSW中的每层NSW中,每个节点与不超过m个邻居节点相连接;
获取待召回知识点的用户问句,并确定所述用户问句的句子向量;
从所述多层NSW的最上层NSW开始,按照从上到下的顺序对各层NSW进行层搜索;所述层搜索包括:根据当前层NSW所包含的节点的连接关系,从当前层NSW所包含的节点中,搜索距离所述句子向量最近的第一节点,经由该第一节点进入下一层NSW,直至到达最下层NSW;
在所述最下层NSW中,根据所述N个节点的连接关系,从所述N个节点中搜索距离所述句子向量最近的节点作为目标节点;
将所述目标节点所代表的类簇中心对应的知识点类簇作为所述用户问句所属的目标类簇;并从归属于所述目标类簇的各知识点标题对应的知识点中,召回与所述用户问句相匹配的知识点。
2.根据权利要求1所述的方法,所述根据当前层NSW所包含的节点的连接关系,从当前层NSW所包含的节点中,搜索距离所述句子向量最近的第一节点,包括:
以当前层NSW的开始节点为初始的当前节点,从当前节点和与当前节点具有连接关系的邻居节点中,确定出距离所述句子向量最近的节点作为更新的当前节点,将达到搜索结束条件时的当前节点确定为所述第一节点,所述第一节点用于作为下一层NSW的开始节点。
3.根据权利要求2所述的方法,所述当前层NSW为最上层NSW,所述开始节点为任意选择的节点。
4.根据权利要求2所述的方法,所述搜索结束条件包括:所述开始节点的n阶邻居节点全部搜索完成,其中,n=1;或者,当前节点与所述句子向量的距离小于所述当前节点的邻居节点与所述句子向量的距离。
5.根据权利要求1所述的方法,所述HNSW通过以下步骤构建得到:
获取知识库中各知识点的知识点标题,得到多个知识点标题;
确定所述多个知识点标题中各知识点标题的句子向量;
对所述各知识点标题的句子向量进行聚类,确定N个知识点类簇;
针对所述N个知识点类簇中的每个知识点类簇,对归属于该知识点类簇的各个知识点标题的句子向量进行求平均或者求加权平均,得到该知识点类簇的类簇中心的中心向量;
将N个知识点类簇的类簇中心的中心向量作为数据集,并基于所述数据集,采用HNSW算法,构建所述HNSW。
6.根据权利要求5所述的方法,所述基于所述数据集,采用HNSW算法,构建所述HNSW,包括:
迭代地执行以下步骤,直至所述数据集中的最后一个类簇中心的中心向量选取完成:
从所述数据集中选取一个类簇中心的中心向量,通过预定公式,计算该中心向量所落入的目标层级;
对于从所述最下层NSW开始至所述目标层级的NSW的各层NSW,将该一个类簇中心作为一个节点插入所述各层NSW中,并通过朴素查找法在所述各层NSW中查找该一个节点的邻居节点,以及将该一个节点与邻居节点通过连接边连接。
7.根据权利要求5所述的方法,所述对所述各知识点标题的句子向量进行聚类,包括:
采用聚类算法,对所述各知识点标题的句子向量进行聚类;所述聚类算法包括以下任一种:kmeans算法、基于层次的聚类算法、以及基于密度的聚类算法。
8.根据权利要求1所述的方法,所述确定所述用户问句的句子向量,包括:
采用语义编码模型,确定所述用户问句的句子向量;所述语义编码模型包括以下任一种:Bert模型、卷积神经网络CNN、深度神经网络DNN以及Transformer编码器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010302538.3/1.html,转载请声明来源钻瓜专利网。