[发明专利]用于确定客服话术簇的方法及装置有效
| 申请号: | 202010103625.6 | 申请日: | 2020-02-20 |
| 公开(公告)号: | CN111353028B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 王子豪;刘佳;崔恒斌 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06Q30/01 |
| 代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉;刘景峰 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 确定 客服 话术簇 方法 装置 | ||
1.一种用于确定客服话术簇的方法,包括:
根据人工客服数据集确定候选客服话术集;
基于业务话术筛选模型从所述候选客服话术集中确定分别针对不同业务类型的多个业务话术集,所述业务话术筛选模型至少配置有业务匹配度特征维度;
针对各个业务话术集,基于语义模型从该业务话术集中确定至少一个客服话术簇;
其中,基于语义模型从该业务话术集中确定至少一个客服话术簇包括:
基于语义模型确定所述业务话术集所对应的话术语义特征集;
基于密度聚类算法对所述话术语义特征集中的各个话术语义特征进行聚类处理,以从相对应的业务话术集中确定至少一个客服话术簇;
所述方法还包括:
针对各个业务话术集,
基于主题模型确定该业务话术集所对应的话术主题特征集,
基于第一聚类算法对该话术主题特征集中的各个话术主题特征进行聚类处理,以将相对应的业务话术集划分为具有预设定的聚类别数量的多个第一话术聚类簇;
其中,基于密度聚类算法对所述话术语义特征集中的各个话术语义特征进行聚类处理,以从相对应的业务话术集中确定至少一个客服话术簇包括:
针对各个所述第一话术聚类簇,基于密度聚类算法对该第一话术聚类簇所对应的话术语义特征集中的各个话术语义特征进行聚类处理,以将相对应的第一话术聚类簇划分为多个第二话术聚类簇;
根据各个所述第二话术聚类簇,确定所述客服话术簇。
2.如权利要求1所述的方法,其中,所述业务话术筛选模型还配置有用于指示话术质量的以下中的任意一种或多种特征维度:话术长度特征维度、业务成果转化度特征维度、话术通顺度特征维度、话术信息量和话术使用频次。
3.如权利要求1所述的方法,还包括:
确定所述各个第二话术聚类簇中的重心话术;
其中,根据各个所述第二话术聚类簇,确定所述客服话术簇包括:
针对各个第二话术聚类簇组,
根据该第二话术聚类簇组内的第一第二话术聚类簇和第二第二话术聚类簇中的重心话术的话术语义特征来确定语义相似度,
根据所述语义相似度来确定是否将所述第一第二话术聚类簇和所述第二第二话术聚类簇进行归并处理,以确定所述客服话术簇。
4.如权利要求1所述的方法,其中,根据人工客服数据集确定候选客服话术集包括:
对所述人工客服数据集中的至少一个用户标识信息进行归一化处理,以确定所述候选客服话术集。
5.如权利要求1所述的方法,还包括:
获取用户问题集;
在所述用户问题集中确定与各个客服话术簇分别相匹配的用户问题。
6.如权利要求1所述的方法,其中,所述密度聚类算法包括DBSCAN算法和/或HDBSCAN算法。
7.如权利要求1所述的方法,其中,所述主题模型包括以下中的任意一种:LDA模型、LSA模型和PLSA模型。
8.如权利要求1所述的方法,其中,所述第一聚类算法包括以下中的至少一者:K均值聚类算法、均值偏移聚类算法和层次聚类算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010103625.6/1.html,转载请声明来源钻瓜专利网。





