[发明专利]一种大规模客户投诉数据自动分类方法有效
| 申请号: | 201810431307.5 | 申请日: | 2018-05-08 |
| 公开(公告)号: | CN108710651B | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 胡金龙;曹丽洁;何杏萍;董守斌 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/216;G06N3/04;G06N3/08;G06Q30/00 |
| 代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 陈宏升 |
| 地址: | 510640 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 大规模 客户 投诉 数据 自动 分类 方法 | ||
本发明公开了一种大规模客户投诉数据自动分类方法,包括以下步骤:收集投诉文本数据,并进行预处理;构建第一投诉分类器和第二投诉分类器;根据过滤规则,满足过滤规则分配第一分类标签;不满足过滤规则使用第一投诉分类器进行分类;有第一分类标签的投诉文本数据,没有对应第二投诉分类器,且第一分类标签条目大于第一门限值,则增加一个第二投诉分类器,进行再分类,得到第二分类标签;有对应第二投诉分类器,进行再分类,得到第二分类标签;本发明构建分类器,将投诉文本数据转化为向量,进行分类,通过生成特征词表和TF‑IDF权重值进行聚类和再分类,从而对投诉文本数据进行多层分类,实现快速而准确的对投诉数据文本进行分类。
技术领域
本发明涉及数据处理研究领域,特别涉及一种大规模客户投诉数据自动分类方法。
背景技术
客户投诉是客户对一个企业在产品质量、服务水平、服务态度等多方位问题的集中式反馈的具体表现,也是企业收集客户意见、整理客户建议的有效途径;因此,高效的客户投诉数据分类方法,能够及时洞察和发现客户投诉信息的变化,提高客户管理的相应速度和服务水平。
随着移动互联网技术及应用的发展,可以通过微信、移动应用程序等方式快速地进行投诉,这也就产生大量的、非结构化的客户投诉文本数据,而且,随着语音识别技术的发展,大量的客户投诉语音可以快速的被识别为文本数据,这时,就需要对其文本数据进行及时处理,并准确地挖掘海量投诉文本信息中所蕴含的各种问题;而现有技术难以适应新的需求,会造成大量投诉数据的堆积,无法及时进行处理,且准确度不高。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种大规模客户投诉数据自动分类方法。
本发明的目的通过以下的技术方案实现:
一种大规模客户投诉数据自动分类方法,包括以下步骤:
S1、收集投诉文本数据,对投诉文本数据进行预处理;
S2、构建第一投诉分类器和第二投诉分类器;
S3、根据过滤规则,对预处理后的投诉文本数据进行过滤,满足过滤规则的投诉文本数据,分配第一分类标签;不满足过滤规则的投诉文本数据,使用第一投诉分类器进行分类;
S4、得到第一分类标签的投诉文本数据,没有对应第二投诉分类器,且第一分类标签投诉文本数据条目大于第一门限值,则将第一分类标签投诉文本数据增加一个第二投诉分类器,对第一分类标签进行分类,得到第二分类标签;有对应第二投诉分类器,则用第二投诉分类器进行再分类,得到第二分类标签。
步骤S1中,所述预处理包括投诉文本数据分词、去除标点符号、停用词;
所述投诉文本数据分词是使用中文分词工具将中文文本中的汉字序列切分成一个一个单独的词;所述停用词是将没有实际含义的词整理出一个停用词表,分词后,将停用词表中的词去掉。
步骤S2中,先构建第一投诉分类器和第二投诉分类器,其中第一投诉分类器的构建过程如下:
T1、对投诉文本数据进行预处理;
T2、使用投诉文本数据生成投诉字典;
T3、将投诉文本数据转化为序列向量,然后转化为等长向量,长度小于m的向量在后面补0,m=200;得到二维向量;
T4、构建CNN+LSTM神经网络模型,包括六个神经网络层:嵌入层,SpatialDropout1D层,一维卷积层,MaxPooling1D层,LSTM层,Dense层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810431307.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





