[发明专利]一种多特征融合的文本情感分析模型及装置有效
申请号: | 202110630740.3 | 申请日: | 2021-06-07 |
公开(公告)号: | CN113204624B | 公开(公告)日: | 2022-06-14 |
发明(设计)人: | 包铁;刘露;刘圣洁;张雪松;彭涛 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/242;G06F40/279;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 曹书华 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 融合 文本 情感 分析 模型 装置 | ||
本发明属于智能文本情感分析技术领域,具体为一种多特征融合的文本情感分析模型及装置,包括包括登录模块、单输入预测模块和批量预测模块,其中登录模块,用户需要登录系统;单输入预测模块,该模块可以预测一条文本的情感极性,由用户手动输入预测内容,点击提交则显示预测标签结果,预测标签共分为三种:积极、消极和中性;批量预测模块,该模块可以对批量文本进行预测,先由数据上传模块上传待分析的文本集,遍历其中每条文本进行预测,其结构合理,结合文本卷积神经网络与双向长短期记忆神经网络,并引入自注意力机制来增加文本中重要词语所占权重,提高了文本情感分析的准确率。
技术领域
本发明涉及智能智能文本情感分析技术领域,具体为一种多特征融合的文本情感分析模型及装置。
背景技术
将深度学习应用于文本情感分析任务的过程中,首先需要对文本进行词向量化,然后输入到神经网络中提取情感特征。但由于微博文本内容丰富、形式多样的特点,仅仅由文本词向量构成的语义特征不能全面表达微博文本的情感信息,所以本发明提出一种基于多特征融合的文本情感分析方法。针对微博文本自身特点构建了多种特征,如基于词典的情感值特征、表情特征以及改进的语义特征。融合多特征形成文本情感分类模型,该模型可以从多特征向量矩阵中学习到文本更多维度的情感信息,在自建数据集上与传统CNN模型及其他单一特征模型进行对比,实验结果显示其情感分类能力得到有效提升。
随着社交媒体的迅速发展,微博成为热门网络社交平台之一,越来越多的用户在微博上发表评论去表达自己的观点态度,微博短文本也成为新兴的文本形式。挖掘微博文本背后隐藏的情感倾向,对舆情分析等有重要价值。相比于传统文本,微博文本具有内容较短、表情符号多、形式多样化等特点,因此,仅在文本词向量上提取语义特征不足以涵盖微博文本所有的情感信息,这类方法没有考虑到文本中丰富的表情符号,以及不同词语对文本的重要程度不同。
以表情符号为例,微博上表情符号越来越受欢迎,很多用户在发表评论时,会在文字中加入符合情绪的表情符号,相关研究表明,表情符号可以增强用户的情感表达。微博作为日常网络交流的平台,提供了许多默认的表情符号,便于用户更生动直观的表达自己的感受。可见,表情符号在微博文本情感分析中意义重大。然而现有方法大多只关注了文本的研究,忽略了表情符号等数据,这可能导致情感表达的缺失,从而影响后续情感倾向性判断。
为了解决上述问题以及挖掘微博文本中更全面的情感信息,本发明提出一种基于多特征融合的文本情感分析方法,在文本词向量的语义特征基础上,增加了三种情感特征:基于词典的情感值特征、表情特征、改进的语义特征。根据情感词典计算整条文本的情感值作为基于词典的情感值特征。因为表情符号可以更直观的体现情感,提取出文本中表情符号的相关信息作为单独的表情特征。提出TF-IDF算法加权的Word2vec模型,称为改进的Word2vec模型,用于文本向量化,作为改进的语义特征。将多种特征融合形成多特征向量矩阵,从更多角度学习文本中包含的情感特征。
发明内容
本部分的目的在于概述本发明的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于现有文本情感分析模型中存在的问题,提出了本发明。
因此,本发明的目的是提供一种多特征融合的文本情感分析模型及装置,能够实现在使用的过程中,结合文本卷积神经网络与双向长短期记忆神经网络,并引入自注意力机制来增加文本中重要词语所占权重,提高了文本情感分析的准确率。
为解决上述技术问题,根据本发明的一个方面,本发明提供了如下技术方案:
一种多特征融合的文本情感分析装置,其特征在于:包括登录模块、单输入预测模块和批量预测模块:
其中,
登录模块,用户需要登录系统;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110630740.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种吹风式干身干脚一体机
- 下一篇:一种电影评论情感分析模型及装置