[发明专利]客服日志反馈回流数据库的方法及系统有效
申请号: | 202110070717.3 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112800219B | 公开(公告)日: | 2022-12-30 |
发明(设计)人: | 陈超 | 申请(专利权)人: | 苏宁金融科技(南京)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332;G06F16/31;G06F40/126;G06F40/242;G06Q30/00 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 盛安平 |
地址: | 211800 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 客服 日志 反馈 回流 数据库 方法 系统 | ||
本发明公开一种客服日志反馈回流数据库的方法及系统,涉及人工智能技术领域,可以有效降低运维人员处理日志样本的工作量,提升处理效率。该方法包括:根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;针对客服日志预处理后得到待标注日志样本;将待标注日志样本进行聚合处理,分割成至少一个问句类簇;从每个问句类簇中筛选出一个待标注日志样本,分类标注后反馈回流至数据库中。该系统应用有上述方案所提的方法。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种客服日志反馈回流数据库的方法及系统。
背景技术
在金融科技领域,智能对话机器人产品的应用,如智能客服、催收机器人、智能营销机器人等是提升金融服务能力,降低人力成本的重要组成部分。这些机器人产品在投入运营以后所产生的日志,对提高产品模型质量、促进产品技术迭代、提升产品服务效果具有重要意义。
在实际应用中,如何收集、存储客服日志,并且经过处理以后回流到客服系统,现有技术存在诸多不足之处。首先,在对话日志收集环节中的日志缺失,缺乏统一的管理和存储。其次,客服系统需要不断添加样本日志对知识库进行维护,但是目前基于手工添加的方式效率低下。
发明内容
本发明的目的在于提供一种客服日志反馈回流数据库的方法及系统,可以有效降低运维人员处理日志样本的工作量,提升处理效率。
为了实现上述目的,本发明的第一方面提供一种客服日志反馈回流数据库方法,包括:
根据采集字段从客服系统中采集对应的咨询问句,形成客服日志;
针对所述客服日志预处理后得到待标注日志样本;
将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇;
从每个所述问句类簇中筛选出一个待标注日志样本,分类标注后反馈回流至数据库。
优选地,在步骤根据预设的采集字段从客服系统中采集对应的咨询问句之前包括:
针对用户在客服系统中提出的咨询问句,基于预设的打标规则分别对各所述咨询问句进行编码打标。
较佳地,根据采集字段从客服系统中采集对应的咨询问句,形成客服日志的方法包括:
将所述编码作为采集字段,定时从客服系统中采集与采集字段编码一致的咨询问句形成客服日志;
采用接口或者消息队列的形式将所述客服日志发送至日志存储系统中保存。
进一步地,针对所述客服日志预处理后得到待标注日志样本的方法包括:
定时和/或定量从日志存储系统中抽取所述客服日志,构建待处理数据集;
从待处理数据集中依次抽取所述客服日志,删除日志长度小于阈值长度的客服日志;
从剩余的待处理数据集中依次抽取所述客服日志,删除数据库中已存在的客服日志;
从剩余的待处理数据集中依次抽取所述客服日志,采用纠错词典对所述客服日志做纠错处理;
从纠错后的待处理数据集中抽取所述客服日志,采用归一化文本编码的方式编码后得到与所述客服日志一一对应的待标注日志样本。
优选地,将所述待标注日志样本进行聚合处理,分割成至少一个问句类簇的方法包括:
基于多个所述待标注日志样本的相似度,将其中互为相似的所述待标注日志样本聚合在一起形成问句类簇。
较佳地,从每个所述问句类簇中筛选出一个待标注日志样本的方法包括:
统计每个所述问句类簇中相同待标注日志样本的出现频率,筛选出频率最高的待标注日志样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏宁金融科技(南京)有限公司,未经苏宁金融科技(南京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110070717.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型组合式并联变换电源模组及控制方法
- 下一篇:一种路线规划方法及装置