[发明专利]一种批量投诉的识别方法及装置在审
申请号: | 202210733483.0 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115062149A | 公开(公告)日: | 2022-09-16 |
发明(设计)人: | 张辉;李俊;杨建昆 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06K9/62;G06N3/04 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 孙小明 |
地址: | 100033*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 批量 投诉 识别 方法 装置 | ||
1.一种批量投诉的识别方法,其特征在于,包括:
将接收到的各个投诉文本转化为文本向量;
根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;所述距离用于表征所述任意两个文本向量对应的投诉文本的语义相近程度;
在所述数量达到设定阈值时,确定所述预设距离范围内文本向量对应的投诉文本为批量投诉;
根据所述预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。
2.根据权利要求1所述的方法,其特征在于,所述将接收到的各个投诉文本转化为文本向量,包括:
将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语;
将所述多个词语中每一个词语转化为词向量;
通过多个词向量组成所述任一投诉文本对应的文本向量。
3.根据权利要求2所述的方法,其特征在于,所述将多个词语中每一个词语转化为词向量,包括:
获取预先构建的多组词语与词向量之间的对应关系;所述对应关系是基于预训练的词向量转化模型生成的;
根据多组对应关系,确定所述多个词语中每一个词语对应的词向量。
4.根据权利要求2或3所述的方法,其特征在于,所述将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语,包括:
将所述任一投诉文本与预先配置的词语库进行匹配,确定匹配成功的词语;
将剔除所述匹配成功的词语后的所述任一投诉文本进行拆词处理,将拆词得到的词语与所述匹配成功的词语组成述任一投诉文本对应的多个词语。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量,包括:
分别计算第一文本向量与所述各文本向量中除所述第一文本向量外的其他文本向量之间的距离;
将与所述第一文本向量距离小于预设值的文本向量的数量,作为所述第一文本向量预设距离范围内的文本向量的数量;
其中,所述第一文本为所述各文本向量中的任意一个文本向量。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
向投诉处理人员的设备发送所述批量投诉警报信息、所述预设距离范围内文本向量的数量和所述预设距离范围内文本向量对应的投诉文本。
7.一种批量投诉的识别装置,其特征在于,包括:
通信单元,用于接收多个投诉文本;
处理单元,被配置为执行:
将各个投诉文本转化为文本向量;
根据任意两个文本向量之间的距离,确定各文本向量预设距离范围内的文本向量的数量;所述距离用于表征所述任意两个文本向量对应的投诉文本的语义相近程度;
在所述数量达到设定阈值时,确定所述预设距离范围内文本向量对应的投诉文本为批量投诉;
根据所述预设距离范围内文本向量对应的投诉文本,输出批量投诉警报信息。
8.根据权利要求7所述的装置,其特征在于,所述处理单元,具体用于:
将任一投诉文本进行拆词处理,得到所述任一投诉文本对应的多个词语;
将所述多个词语中每一个词语转化为词向量;
通过多个词向量组成所述任一投诉文本对应的文本向量。
9.根据权利要求8所述的装置,其特征在于,所述处理单元,具体用于:
获取预先构建的多组词语与词向量之间的对应关系;所述对应关系是基于预训练的词向量转化模型生成的;
根据多组对应关系,确定所述多个词语中每一个词语对应的词向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210733483.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:运维方法、装置、系统及计算机程序产品
- 下一篇:一种用于密集架的防侧翻装置