[发明专利]一种基于词向量的针对汽车产品评论的情感分析方法在审

专利信息
申请号: 201811115658.1 申请日: 2018-09-25
公开(公告)号: CN109408809A 公开(公告)日: 2019-03-01
发明(设计)人: 邱泽成;郭伟;汪金亮;安蔚瑾 申请(专利权)人: 天津大学
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 李林娟
地址: 300350 天津市津南区海*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于词向量的针对汽车产品评论的情感分析方法,所述方法包括以下步骤:获取汽车领域关键词库,并对原始文本进行预处理,形成待标注文本;针对待标注样本,依据时间跨度标准与车型等级标准选取样本;利用word2vec模型获得待分析文本的词向量,并由词向量均值获得高维语句向量;利用PCA主成分分析对高维语句向量进行降维,将降维后的语句向量、以及情感分类人工标注结果作为特征训练SVM分类器;利用分类器对新的文本进行情感分析,生成情感分析判定结果。本发明基于汽车产品知识本体,针对性的搭建领域词库,并且针对领域内评论文本进行有效标注,利用词向量化和机器学习模型获得更加准确的情感分析结果。
搜索关键词: 情感分析 词向量 汽车产品 向量 语句 标注 文本 高维 降维 样本 预处理 机器学习模型 主成分分析 等级标准 关键词库 模型获得 判定结果 评论文本 汽车领域 情感分类 人工标注 时间跨度 特征训练 原始文本 知识本体 分类器 向量化 词库 评论 车型 分析
【主权项】:
1.一种基于词向量的针对汽车产品评论的情感分析方法,其特征在于,所述方法包括以下步骤:获取汽车领域关键词库,并对原始文本进行预处理,形成待标注文本;针对待标注样本,依据时间跨度标准与车型等级标准选取样本;利用word2vec模型获得待分析文本的词向量,并由词向量均值获得高维语句向量;利用PCA主成分分析对高维语句向量进行降维,将降维后的语句向量、以及情感分类人工标注结果作为特征训练SVM分类器;利用分类器对新的文本进行情感分析,生成情感分析判定结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811115658.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top