[发明专利]一种基于机器学习的电商产品客户满意度分析方法在审
申请号: | 201711303030.X | 申请日: | 2017-12-04 |
公开(公告)号: | CN108038725A | 公开(公告)日: | 2018-05-15 |
发明(设计)人: | 徐新胜;余建浙 | 申请(专利权)人: | 中国计量大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06F17/27;G06N99/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 产品 客户 满意 分析 方法 | ||
1.一种基于机器学习的电商产品客户满意度分析方法,其特征是包括如下步骤:
步骤S1:从相关电商平台获取电商产品评论文本,进行分词、词性标注等数据预处理;
步骤S2:选定汉语组块标记符号,对步骤S1中得到的分词结果进行手工标注,作为获取汉语组块模型的训练样本;
步骤S3:利用所述步骤S2中得到的训练样本,基于Lib-SVM工具训练,得到可以在商品评论文本中自动标注汉语组块的模型,然后在全部评论上进行汉语组块的自动标注,进而选取名词性汉语组块作为候选商品特征词集合,并对候选集合按照一定的规则进行过滤;
步骤S4:构建情感词典,利用所述步骤S3中得到的商品特征词集合,计算商品每个特征的情感得分;
步骤S5:利用所述步骤S3中得到的商品特征词集合,训练特征词的词向量模型,得到商品特征词的向量表示;
步骤S6:利用所述步骤S5中得到的商品特征词向量,基于词向量相似度,对商品特征词进行客户满意度聚类分析,利用所述步骤S4中得到的商品每个特征的情感得分,计算出每一类的平均分作为最终得分。
2.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S1中,数据预处理包括评论分词、词性标注、词频统计、停用词过滤以及低频词语过滤。
3.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S2中,汉语组块标注的方法是:汉语组块总共有13种,根据重要性选取出最常见的8种作为标记符号,采用IOB2的标注集合来标注汉语组块,根据每个词的前、后的2个词的词性和依存关系,手工给予每个词的汉语组块标注;汉语组块标注完成后,完成每个词和汉语组块一一对应。
4.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S3中,商品特征词提取的方法是:根据步骤S2中标注的汉语组块,选取每个词的词、词性以及前、后2个词的词、词性和汉语组块标记作为训练的输入特征,基于Lib-SVM工具,训练出汉语组块提取模型;利用模型在全部评论文本上提取出名词性汉语组块作为候选商品特征词集合,计算每个候选特征词的TF-IDF值,给定一定阈值进行过滤。
5.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S4中,商品特征词情感得分的方法是:收集及整合网上的情感词典,主要以知网的情感词典和台湾大学的情感极性词典为主,对不同类别的词进行数值化;在每一条评论中,给定一定的距离,根据步骤S3得到的商品特征词集合,结合情感词典计算出每条评论中含有的商品特征词情感得分。
6.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S5中,利用S3中得到的商品特征词集合,获得词语的向量表示的方法是:使用Word2Vec开源工具,训练商品特征词集合;然后得到特征词向量表示,是一种较低维度的连续值向量,每个词语向量具有相同的维度,维度的大小作为超参数在训练前人工指定,常用50维或100维。
7.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S6中,基于词向量的特征词相似度计算方法是:根据步骤S5中特征词的词向量表示,利用Word2Vec自带的相似度计算工具,可以计算出每个特征词与剩余特征词的相似度,得到的结果是0到1的小数,数值越大代表越相似。
8.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S6中,客户满意度聚类方法是:根据客户满意度的五个类别定义,包括信赖度、专业度、有形度、同理度和反映度,基于步骤S3中提取的商品特征词集合,对于每个类别人工筛选出十个最具代表并且唯一类别的商品特征词,结合步骤S6词向量的特征词相似度计算方法,剩余的每个特征词依次与五个类别中的十个特征词进行相似度计算,最后选取平均相似度最大的类别进行归类。
9.如权利要求1所述的基于机器学习的电商产品客户满意度分析方法,其特征是,所述步骤S6中,客户满意度总得分计算方法:结合步骤S6客户满意度聚类结果和步骤S4商品特征词情感得分,可以获取客户满意度每个类中所有产品特征词情感得分,然后对每个类别中的特征词加权平均,作为客户满意度每个类别的最终得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国计量大学,未经中国计量大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711303030.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种沉铜前锣槽的加工方法
- 下一篇:护理用内推式振荡装置