[发明专利]一种基于词向量的针对汽车产品评论的情感分析方法在审

专利信息
申请号: 201811115658.1 申请日: 2018-09-25
公开(公告)号: CN109408809A 公开(公告)日: 2019-03-01
发明(设计)人: 邱泽成;郭伟;汪金亮;安蔚瑾 申请(专利权)人: 天津大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 李林娟
地址: 300350 天津市津南区海*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 情感分析 词向量 汽车产品 向量 语句 标注 文本 高维 降维 样本 预处理 机器学习模型 主成分分析 等级标准 关键词库 模型获得 判定结果 评论文本 汽车领域 情感分类 人工标注 时间跨度 特征训练 原始文本 知识本体 分类器 向量化 词库 评论 车型 分析
【说明书】:

发明公开了一种基于词向量的针对汽车产品评论的情感分析方法,所述方法包括以下步骤:获取汽车领域关键词库,并对原始文本进行预处理,形成待标注文本;针对待标注样本,依据时间跨度标准与车型等级标准选取样本;利用word2vec模型获得待分析文本的词向量,并由词向量均值获得高维语句向量;利用PCA主成分分析对高维语句向量进行降维,将降维后的语句向量、以及情感分类人工标注结果作为特征训练SVM分类器;利用分类器对新的文本进行情感分析,生成情感分析判定结果。本发明基于汽车产品知识本体,针对性的搭建领域词库,并且针对领域内评论文本进行有效标注,利用词向量化和机器学习模型获得更加准确的情感分析结果。

技术领域

本发明涉及文本挖掘与自然语言处理领域,尤其涉及一种基于词向量的针对汽车产品评论的情感分析方法。

背景技术

近年来,汽车产业在中国正以可喜的态势迅速发展。据公安部统计,截至2017年底,全国机动车保有量达到3.10亿辆,其中汽车2.17亿辆;机动车驾驶人达3.85亿人次,其中汽车驾驶人4.42亿人次[1]。持续的收入增长与汽车产品成本的优化控制,使得越来越多的家庭接触到汽车产品。2017年在公安交通管理部门新注册登记的机动车3352万辆,其中新注册登记汽车2813万辆,均创历史新高[2]。汽车产品由原来的资产性商品逐渐转型为消费型商品。越来越多的家庭已经加入到从买车到用车再到换车的消费循环中。

与此同时,汽车垂直领域平台也面临互联网技术飞速进步和流量突增的风口,它们不再局限于原先的权威参数、新鲜资讯以及独立测评,而有意吸引更多用户参与到汽车产品的交互和讨论中去,吸引用户留下对汽车产品的使用感受和主观评价[3]。这些原创内容及其背后的阅读量和购买意向能够为网站带来深厚的数据积累和潜在利润,促进了消费者对产品的评价由传统的口口相传、广告效应向用户在线评论的转化[4]

用户针对其使用过的汽车产品在网站平台上所发表的口碑、评论等文本内容具有较高的参考价值。一方面原因是其基于车主宝贵的自身使用经验,汽车产品的购买者、使用者带有主观色彩的现身说法,其在选车、购车、提车、用车、养车、修车过程中的真实经历能在较大程度上影响潜在消费者的判断与倾向[5]。具有好的口碑和评论的汽车产品,往往能够使潜在消费者坚定购买的信心,因而存在较大的概率促成新的交易,而保守差评的汽车产品也能动摇潜在消费者的信心,造成客户流失[6]。另一方面原因由于汽车产品本身结构复杂、综合体验各有说法,潜在消费者难以像购买普通小额消费品一样从冰冷的参数配置中获得全部信息[7]

基于此,面向汽车垂直领域的网站平台,结合文本挖掘与数据处理技术,对其中的用户原创内容进行分析,构建一种能够准确判断用户评论情感倾向的分析方法,从而产出用户对某款汽车产品、产品某个属性的褒贬意见,对生产厂家进行产品改进迭代,或是对于消费者进行售比对甄别,都具有重要的现实意义。

现有技术中较多依靠通用词典进行分词,依靠情感词典的正负情感词以及其他形容词进行情感极性判别;或是基于机器学习的方式,对通用文本进行正负面情感分类。

现有的技术在针对汽车领域进行分析时,存在如下问题:

1)对汽车专业领域的词典广度与深度不够,并不能覆盖汽车产品的全部结构和功能;

2)对用户原创内容的词典支持欠缺,用户在网络上表达主观感受的时候会使用汽车产品的缩略词(如“前四后四”)、外号(如“马六”、“四儿子”)等,缺乏考虑互联网语境的词典会造成情感分析结果的准确性降低;

3)情感词典中同一个情感词会因处于不同的语境中而表达不同甚至截然相反的情感倾向(如“性价比高”与“油耗高”);

4)以TF-IDF(词频-逆文本频率指数)为特征的机器学习模型输入不能很好的反应文本的语义与上下文环境。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811115658.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top