[发明专利]一种批量投诉的识别方法及装置在审
申请号: | 202210733483.0 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115062149A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 张辉;李俊;杨建昆 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06K9/62;G06N3/04 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 孙小明 |
地址: | 100033*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 批量 投诉 识别 方法 装置 | ||
本申请公开了一种批量投诉的识别方法及装置,用以通过计算机自动发现和识别批量投诉,不再依赖人工,提升批量投诉识别的效率和准确率。该方法包括:将接收到的各个投诉文本转化为文本向量;根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;距离用于表征任意两个文本向量对应的投诉文本的语义相近程度;在数量达到设定阈值时,确定预设距离范围内文本向量对应的投诉文本为批量投诉;根据预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种批量投诉的识别方法及装置。
背景技术
目前,各类运营商客户的投诉服务工作均为人工处理,那么在由于某一个故障导致一大批客户投诉的情况时,这种批量投诉故障前期隐蔽性强,如果不能及时发现和处理将会演变为重大投诉事件。目前的识别和发现批量投诉完全依靠人工,识别周期长,效率低下。因此,目前亟需一种能够通过计算机自动识别和发现批量投诉的方法。
发明内容
本申请示例性的实施方式中提供一种批量投诉的识别方法及装置,用以通过计算机自动发现和识别批量投诉,不再依赖人工,提升批量投诉识别的效率和准确率。
第一方面,本申请实施例提供了一种批量投诉的识别方法,包括:
将接收到的各个投诉文本转化为文本向量;
根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;所述距离用于表征所述任意两个文本向量对应的投诉文本的语义相近程度;
在所述数量达到设定阈值时,确定所述预设距离范围内文本向量对应的投诉文本为批量投诉;
根据所述预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。
基于上述方案,本申请提出了采用计算设备自动处理投诉文本,得到投诉文本对应的文本向量,基于文本向量之间的距离对文本向量进行聚类处理,并根据聚类的结果判断是否存在批量投诉。不再需要依赖人工,提升了批量投诉识别的效率,可以及时解决引起批量投诉的故障问题,避免演变为重大的投诉事件。
在一些实施例中,所述将接收到的各个投诉文本转化为文本向量,包括:
将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语;
将所述多个词语中每一个词语转化为词向量;
通过多个词向量组成所述任一投诉文本对应的文本向量。
在一些实施例中,所述将多个词语中每一个词语转化为词向量,包括:
获取预先构建的多组词语与词向量之间的对应关系;所述对应关系是基于预训练的词向量转化模型生成的;
根据多组对应关系,确定所述多个词语中每一个词语对应的词向量。
基于上述方案,根据预先构建的对应关系来实现转化词向量的操作,不仅提升了转化的效率还能够提升转化的准确性。
在一些实施例中,所述将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语,包括:
将所述任一投诉文本与预先配置的词语库进行匹配,确定匹配成功的词语;
将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理,将拆词得到的词语与所述匹配成功的词语组成述任一投诉文本对应的多个词语。
基于上述方案,拆词处理时,首先根据预先配置的词语库进行匹配,可以准确地识别行业内的专业术语,提升拆词的准确率。
在一些实施例中,所述根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210733483.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:运维方法、装置、系统及计算机程序产品
- 下一篇:一种用于密集架的防侧翻装置