[发明专利]一种基于情感极性增强语义的跨领域情感分析方法有效

专利信息
申请号: 201711266642.6 申请日: 2017-12-05
公开(公告)号: CN107967337B 公开(公告)日: 2021-10-15
发明(设计)人: 姬晨;李维华;王翔;郭延哺;段云浩 申请(专利权)人: 云南大学
主分类号: G06F16/35 分类号: G06F16/35;G06F40/216
代理公司: 云南凌云律师事务所 53207 代理人: 董建国
地址: 650091*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 情感 极性 增强 语义 领域 分析 方法
【说明书】:

本发明属于文本分析领域,公开了一种基于情感极性增强语义的跨领域情感分析方法。本发明提取源领域和目标领域情感文本的词项,并向量化;其次,选择源领域和目标领域之间的情感强烈且语义一致的词项作为领域间共享词;第三,基于共享词的情感极性分别对情感文本进行扩展,并重新训练词向量,增强情感语义;最后,基于卷积神经网络自动提取文本的情感特征,并训练分类器完成目标领域情感文本的分类。本发明考虑共享词的情感极性和领域间情感语义的一致性,以及对情感特征提取和分类的影响,更符合跨领域情感分析实际特点和需求。

技术领域

本发明属于文本分析领域,涉及一种跨领域情感分析方法,更为具体地是涉及一种情感文本共享词的选择以及基于共享词的情感语义增强方法。

背景技术

情感文本指的是带有主观情感倾向的文本。对文本的情感倾向进行分析,是舆情监控、口碑分析、话题监控等应用的重要技术基础。跨领域情感分析,研究的是在情感带有主题相关性和领域相关性、以及目标领域样本稀疏的条件下,如何充分利用相关源领域样本进行分析的技术问题。

解决跨领域情感文本分析的关键是缩小源领域和目标领域之间的差异,将源领域的知识迁移到目标领域中,帮助目标领域建立预测模型,并尽可能地提高预测的性能。目前跨领域情感分析主要的技术方案可以分为三类,基于词典的方法,基于传统的机器学习方法以及基于深度学习的方法。基于词典的方法缺点是受词典的影响。基于传统的机器学习方法,不仅要求事先从情感文本中提取文本特征,而且这个分析的过程依赖经验和特定任务,例如谭松波等“一种跨领域的文本情感分类器的训练方法和分类方法”(2014年03月12日公布,授权公告号为CN101714135B的中国发明专利)。基于传统的机器学习方法,源领域和目标领域的共同词项(共享词)的选择主要依赖于词汇特征和句子特征,没有充分考虑情感语义。基于深度学习的跨领域情感分析,例如贾熹滨等提出“一种建立大规模跨领域文本情感倾向性分析框架的方法”(2016年11月9日公布,公布号为CN106096004A的中国发明专利申请),王勤勤等提出“基于word2vec的跨领域情感分类方法”(《计算机应用研究》,2018年第35卷第10期),余传明灯提出“基于深度表示学习的跨领域情感分析”(《数据分析与知识发现》,2017年第7期)。但是,这些方法即使考虑领域间共享词的桥梁作用,但仅采用共现、词频等单一且简单的度量指标选择共享词。

如何有效地选择共享词、充分发挥共享词的桥梁作用、以及针对跨领域情感分析任务有效地自动提取文本特征,提高目标领域的情感文本分类准确率,还有待进一步研究。

发明内容

针对现有技术中存在的不足,本发明在现有技术的基础上提出一种基于情感极性增强语义的跨领域情感分析方法,定量度量源领域和目标领域上情感语义的一致性,并结合情感极性值进行共享词的选择,基于共享词的极性增强情感语义,发挥共享词的桥梁作用并基于共享词提取文本情感特征,进一步提高目标领域情感文本分类的准确率。具体来说,本发明具体技术方案包括:

S1、提取源领域和目标领域中的情感文本的词项集WSWT,并转化成词向量表VSVT

S2、在WSWT中对词频大于预设阀值的词项,计算词项的情感极性值,计算领域间词项的语义一致性因子,通过情感极性值筛选典型的正面情感词和负面情感词,再基于词项的语义一致性因子进一步筛选得到共享词集合F;

S3、基于共享词集合F的情感极性增强语义;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711266642.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top