[发明专利]一种基于词向量的针对汽车产品评论的情感分析方法在审
申请号: | 201811115658.1 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109408809A | 公开(公告)日: | 2019-03-01 |
发明(设计)人: | 邱泽成;郭伟;汪金亮;安蔚瑾 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F17/27 | 分类号: | G06F17/27 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300350 天津市津南区海*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于词向量的针对汽车产品评论的情感分析方法,所述方法包括以下步骤:获取汽车领域关键词库,并对原始文本进行预处理,形成待标注文本;针对待标注样本,依据时间跨度标准与车型等级标准选取样本;利用word2vec模型获得待分析文本的词向量,并由词向量均值获得高维语句向量;利用PCA主成分分析对高维语句向量进行降维,将降维后的语句向量、以及情感分类人工标注结果作为特征训练SVM分类器;利用分类器对新的文本进行情感分析,生成情感分析判定结果。本发明基于汽车产品知识本体,针对性的搭建领域词库,并且针对领域内评论文本进行有效标注,利用词向量化和机器学习模型获得更加准确的情感分析结果。 | ||
搜索关键词: | 情感分析 词向量 汽车产品 向量 语句 标注 文本 高维 降维 样本 预处理 机器学习模型 主成分分析 等级标准 关键词库 模型获得 判定结果 评论文本 汽车领域 情感分类 人工标注 时间跨度 特征训练 原始文本 知识本体 分类器 向量化 词库 评论 车型 分析 | ||
【主权项】:
1.一种基于词向量的针对汽车产品评论的情感分析方法,其特征在于,所述方法包括以下步骤:获取汽车领域关键词库,并对原始文本进行预处理,形成待标注文本;针对待标注样本,依据时间跨度标准与车型等级标准选取样本;利用word2vec模型获得待分析文本的词向量,并由词向量均值获得高维语句向量;利用PCA主成分分析对高维语句向量进行降维,将降维后的语句向量、以及情感分类人工标注结果作为特征训练SVM分类器;利用分类器对新的文本进行情感分析,生成情感分析判定结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811115658.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种文艺作品的评估方法及评估系统
- 下一篇:一种恶意PDF文档检测方法及装置