[发明专利]客服日志反馈回流数据库的方法及系统有效
申请号: | 202110070717.3 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112800219B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 陈超 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F16/31;G06F40/126;G06F40/242;G06Q30/00 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 盛安平 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客服 日志 反馈 回流 数据库 方法 系统 | ||
1.一种客服日志反馈回流数据库方法,其特征在于,包括:根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;
定时和/或定量从日志存储系统中抽取所述客服日志,构建待处理数据集;
对所述待处理数据集进行预处理操作后得到待标注日志样本,所述预处理操作包括但不限于依次对所述待处理数据集中的客服日志进行超短客服日志删除、客服日志去重、文本纠错以及编码归一化操作;
将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇;
统计每个所述问句类簇中相同待标注日志样本的出现频率,筛选出频率最高的待标注日志样本;
确定数据库中是否存在与所述待标注日志样本相似的标准日志样本;其中,所述数据库中包括多个标准日志样本以及对应的问题答案,或者同时包括与所述标准日志样本关联的相似日志样本;
若数据库中不存在与所述待标注日志样本相似的标准日志样本,则在编辑对应的问题答案后将所述待标注日志样本作为标准日志样本反馈回流至数据库中保存;
若数据库中存在与所述待标注日志样本相似的标准日志样本,则将所述待标注日志样本作为对应标准日志样本的相似日志样本反馈回流至数据库中保存。
2.根据权利要求1所述的方法,其特征在于,在步骤根据预设的采集字段从客服系统中采集对应的咨询问句之前包括:
针对用户在客服系统中提出的咨询问句,基于预设的打标规则分别对各所述咨询问句进行编码打标。
3.根据权利要求2所述的方法,其特征在于,根据采集字段从客服系统中采集对应的咨询问句,形成客服日志的方法包括:
将所述编码作为采集字段,定时从客服系统中采集与采集字段编码一致的咨询问句形成客服日志;
采用接口或者消息队列的形式将所述客服日志发送至日志存储系统中保存。
4.根据权利要求3所述的方法,其特征在于,对所述待处理数据集进行预处理操作后得到待标注日志样本,所述预处理操作包括但不限于依次对所述待处理数据集中的客服日志进行超短客服日志删除、客服日志去重、文本纠错以及编码归一化操作,包括:
从待处理数据集中依次抽取所述客服日志,删除日志长度小于阈值长度的客服日志;
从剩余的待处理数据集中依次抽取所述客服日志,删除数据库中已存在的客服日志;
从剩余的待处理数据集中依次抽取所述客服日志,采用纠错词典对所述客服日志做纠错处理;
从纠错后的待处理数据集中抽取所述客服日志,采用归一化文本编码的方式编码后得到与所述客服日志一一对应的待标注日志样本。
5.根据权利要求1或4所述的方法,其特征在于,将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇的方法包括:
基于多个所述待标注日志样本的相似度,将其中互为相似的所述待标注日志样本聚合在一起形成问句类簇。
6.根据权利要求1所述的方法,其特征在于,聚合处理所采用的算法为单遍聚类算法。
7.根据权利要求1所述的方法,其特征在于,所述数据库包括动态库和知识库,所述动态库用于保存时效性小于阈值天数的日志样本数据,所述知识库用于保存时效性大于阈值天数的日志样本数据。
8.一种客服日志反馈回流数据库系统,其特征在于,包括:
采集单元,用于根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;
处理单元,用于定时和/或定量从日志存储系统中抽取所述客服日志,构建待处理数据集;对所述待处理数据集进行预处理操作后得到待标注日志样本,所述预处理操作包括但不限于依次对所述待处理数据集中的客服日志进行超短客服日志删除、客服日志去重、文本纠错以及编码归一化操作;
聚合单元,用于将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇;
标注单元,用于统计每个所述问句类簇中相同待标注日志样本的出现频率,筛选出频率最高的待标注日志样本;确定数据库中是否存在与所述待标注日志样本相似的标准日志样本,其中,所述数据库中包括多个标准日志样本以及对应的问题答案,或者同时包括与所述标准日志样本关联的相似日志样本;若数据库中不存在与所述待标注日志样本相似的标准日志样本,则在编辑对应的问题答案后将所述待标注日志样本作为标准日志样本反馈回流至数据库中保存;若数据库中存在与所述待标注日志样本相似的标准日志样本,则将所述待标注日志样本作为对应标准日志样本的相似日志样本反馈回流至数据库中保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110070717.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型组合式并联变换电源模组及控制方法
- 下一篇:一种路线规划方法及装置