[发明专利]一种基于评论情感分析的汽车销量预测方法在审
申请号: | 201711229414.1 | 申请日: | 2017-11-29 |
公开(公告)号: | CN108563647A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 周应华;商楠 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q30/02 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 汽车 评论数据 情感分析 预处理 准确度 标签分类 操作过程 模型建立 情感因素 销售数据 预测模型 预测数据 评论 操控 网站 融入 安全 服务 生产 | ||
1.一种基于评论情感分析的汽车销量预测方法,其特征在于,包括如下步骤:
1)、对汽车评论数据进行包括统一格式并剔除重复词汇在内的预处理;
2)、利用中科院汉语语法系统对经过预处理后的汽车评论数据进行分词处理,去除停用词;
3)、利用多标签分类技术对对步骤2分词处理后的评论数据集进行多标签分类;
4)、使用互信息技术对情感值进行量化,求得评论文本集的情感值;
5)、将情感值融合进入回归模型预测下个阶段的汽车销量。
2.根据权利要求1所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤1)将汽车评论数据分为舒适、动力、操控、服务、经济和安全六个方面,首先求出一个评论词与类标签之间的关系,公式如下:
其中,n表示文档总数,表示词word不在文档Di中,x2表示某一个词word和汽车某一方面lj之间的相关性,表示不含有lj方面,即p(word,lj)表示词Word在文档Di中出现的次数且lij=1,lj表示汽车的某一方面性能,j表示其中某一种性能编号(1≤j≤6),i表示第i篇文档。p(word)表示词word在文档Di中出现的次数,p(word)表示词word在文档Di中出现的次数,p(lj)文本集中lj出现的次数,表示词word不在文档Di出现的次数。
3.根据权利要求1或2所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤1)使用中科院计算所的汉语词法分析系统ICTCLAS3,首先将搜狗输入法中与汽车行业相关的细胞词库导入汉语词法分析系统,利用UltraEdit编辑器将非文本格式的词库解析出来,统一格式并剔除重复词汇。
4.根据权利要求3所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤2)将数词、代词、量词、拟声词、方位词、连词、叹词、后接成分和助词作为停用词。
5.根据权利要求2所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述使用平均X2的聚合策略来度量X2的值,公式如下:
将X2的值从高到低排序选取部分词作为特征项,一词频作为特征项的权值,使用向量空间模型对文本进行表示,并求得每篇评论文档的特征向量di,采用SVM对文档进行分类。
6.根据权利要求5所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤4)对情感值进行量化具体包括:
当评价分数小于等于2时,认为是负向文本,归属于负向文本集;当评价分数为5时,认为是正向文本,并入正向文本集,文本中每个词word的情感值S(word)计算方式为:
S(word)=P(word,pos)-P(word,neg)
其中f(word,pos)表示word在正向文本集只出现的频次,f(word)表示word在整个文本集中出现的次数;f(pos)表示正向文档的数量;M表示整个文本集的数量,同理可计算P(word,neg)的值,P(word,neg)表示词word与负向文档之间的点互关系;
S(word)计算公式可化简为
则第i篇评论的情感值Srev(rk)为:f(neg)表示负向文档的数量
q表示第i篇评论文档中含有q个情感词典中的词,即每篇评论文本的情感值由每个词的情感值累加而成。
7.根据权利要求6所述的基于评论情感分析的汽车销量预测方法,其特征在于,所述步骤5)使用修改的回归模型AR模型进行预测,用yt表示第t个月的销售量,t=1,2,…,n;n表示未来某个月;
q表示第t个月之前q个月的情感因素的影响,wt表示第t个月的情感影响,αi为最小二乘法得到的模型参数,P表示要考察的第t个月之前的P个月,i表示前P个月中的某个月,α0表示常数项,εt表示误差项,将各个标签下的情感因素分别代入模型,通过训练集的对比可以找出消费者更看中汽车性能的哪一个方面。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711229414.1/1.html,转载请声明来源钻瓜专利网。