[发明专利]一种基于情感极性增强语义的跨领域情感分析方法有效
| 申请号: | 201711266642.6 | 申请日: | 2017-12-05 |
| 公开(公告)号: | CN107967337B | 公开(公告)日: | 2021-10-15 |
| 发明(设计)人: | 姬晨;李维华;王翔;郭延哺;段云浩 | 申请(专利权)人: | 云南大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216 |
| 代理公司: | 云南凌云律师事务所 53207 | 代理人: | 董建国 |
| 地址: | 650091*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 情感 极性 增强 语义 领域 分析 方法 | ||
本发明属于文本分析领域,公开了一种基于情感极性增强语义的跨领域情感分析方法。本发明提取源领域和目标领域情感文本的词项,并向量化;其次,选择源领域和目标领域之间的情感强烈且语义一致的词项作为领域间共享词;第三,基于共享词的情感极性分别对情感文本进行扩展,并重新训练词向量,增强情感语义;最后,基于卷积神经网络自动提取文本的情感特征,并训练分类器完成目标领域情感文本的分类。本发明考虑共享词的情感极性和领域间情感语义的一致性,以及对情感特征提取和分类的影响,更符合跨领域情感分析实际特点和需求。
技术领域
本发明属于文本分析领域,涉及一种跨领域情感分析方法,更为具体地是涉及一种情感文本共享词的选择以及基于共享词的情感语义增强方法。
背景技术
情感文本指的是带有主观情感倾向的文本。对文本的情感倾向进行分析,是舆情监控、口碑分析、话题监控等应用的重要技术基础。跨领域情感分析,研究的是在情感带有主题相关性和领域相关性、以及目标领域样本稀疏的条件下,如何充分利用相关源领域样本进行分析的技术问题。
解决跨领域情感文本分析的关键是缩小源领域和目标领域之间的差异,将源领域的知识迁移到目标领域中,帮助目标领域建立预测模型,并尽可能地提高预测的性能。目前跨领域情感分析主要的技术方案可以分为三类,基于词典的方法,基于传统的机器学习方法以及基于深度学习的方法。基于词典的方法缺点是受词典的影响。基于传统的机器学习方法,不仅要求事先从情感文本中提取文本特征,而且这个分析的过程依赖经验和特定任务,例如谭松波等“一种跨领域的文本情感分类器的训练方法和分类方法”(2014年03月12日公布,授权公告号为CN101714135B的中国发明专利)。基于传统的机器学习方法,源领域和目标领域的共同词项(共享词)的选择主要依赖于词汇特征和句子特征,没有充分考虑情感语义。基于深度学习的跨领域情感分析,例如贾熹滨等提出“一种建立大规模跨领域文本情感倾向性分析框架的方法”(2016年11月9日公布,公布号为CN106096004A的中国发明专利申请),王勤勤等提出“基于word2vec的跨领域情感分类方法”(《计算机应用研究》,2018年第35卷第10期),余传明灯提出“基于深度表示学习的跨领域情感分析”(《数据分析与知识发现》,2017年第7期)。但是,这些方法即使考虑领域间共享词的桥梁作用,但仅采用共现、词频等单一且简单的度量指标选择共享词。
如何有效地选择共享词、充分发挥共享词的桥梁作用、以及针对跨领域情感分析任务有效地自动提取文本特征,提高目标领域的情感文本分类准确率,还有待进一步研究。
发明内容
针对现有技术中存在的不足,本发明在现有技术的基础上提出一种基于情感极性增强语义的跨领域情感分析方法,定量度量源领域和目标领域上情感语义的一致性,并结合情感极性值进行共享词的选择,基于共享词的极性增强情感语义,发挥共享词的桥梁作用并基于共享词提取文本情感特征,进一步提高目标领域情感文本分类的准确率。具体来说,本发明具体技术方案包括:
S1、提取源领域和目标领域中的情感文本的词项集
S2、在
S3、基于共享词集合F的情感极性增强语义;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711266642.6/2.html,转载请声明来源钻瓜专利网。





