[发明专利]一种基于张量融合方式的情感分类的方法有效
申请号: | 201811441312.0 | 申请日: | 2018-11-29 |
公开(公告)号: | CN109614487B | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 李玉军;王玥;冀先朋 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250199 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 融合 方式 情感 分类 方法 | ||
本发明涉及一种基于张量融合方式的情感分类的方法,包括:(1)数据预处理;(2)训练词向量;(3)针对具体任务建模;利用双向LSTM编码每一句话的上下文信息和语义信息,经过每一层网络的作用,得到每一句话的特征向量表示;(4)张量融合:采用张量融合的方式将模型输出的三个特征向量进行融合,通过信息之间的融合,得到最佳全面的特征表示,然后将融合之后形成的特征向量送往分类器进行情感分类。(5)训练模型。本发明不需要人工抽取任何特征,模型也不需要借助另外的自然语言处理工具对数据做预处理,同时不需要提前识别目前词进行情感分类,算法简单明了,效果明显。
技术领域
本发明涉及一种基于张量融合方式的情感分类的方法,属于自然语言处理技术领域。
背景技术
随着当前时代的发展,网络信息化的时代以一种前所未有的速度迅速影响着人们的生活。与此同时,社会媒体也呈现出多样化的形态,论坛、博客以及微博等网络媒介发展迅速,网络用户的参与性不断提高,对于网络的使用方式也产生了巨大的变化。用户不再只是被动的获取网络知识,而是更加积极的成为网络信息的制造者,这样的改变使得网络媒介中呈现出大量的用来表用户情感、情绪和观点的各类形式的主观性信息,而文本则是其中最为重要的一种表现形式。针对这些主观性信息,如何更加有效的利用这些海量的数据,提取出人们感兴趣的、携带观点的文本,并且对其作出准确的分析是迄今为止自然语言处理领域中的非常重要的研究课题之一。
文本情感分析,是自然语言处理研究领域中的一个非常重要的课题,亦可称作意见挖掘,这是对人们的观点,情绪评论,态度以及针对诸如产品、服务、组织、个体、事件、主题等实体的情感倾向作出有效的挖掘和分析,然后进一步对挖掘出来的信息归纳和推理的一类技术。文本情感分析自2002年由Bo Pang提出之后,获得了很大程度的关注,特别是在产品评论等的情感分析上获得了很大程度的关注。早期情感分析研究的方法主要是基于规则的方法和基于统计的方法。主要通过学习目标样本的特征,根据特征的分布对文本作出类别的判断。还有一些我们熟悉的机器学习方法,比如支持向量机,最大熵以及朴素贝叶斯等方法。这些方法建模和计算相对比较简单,但是对于一些复杂的分类问题,这些方法的泛化能力却受到很大的制约。
随着深度学习的发展,以卷积神经网络和循环神经网络为代表的深度神经网络模型在图像处理、计算机视觉和语音识别领域取得了巨大的成功,在自然语言处理领域也取得了很大进展,尤其在文本情感分析方面吸引了广大研究者的兴趣。传统的浅层学习中样本特征的表示采用的是数数的形式,这些深度学习模型则是通过将底层特征进行组合,形成更加抽象的较高层的表示形式,在此基础上获得样本数据的分布式表示。一些研究者采用卷积神经网络模型来做文本情感分析,但是这种方法只能捕捉到局部上下文信息,存在信息丢失的问题。为了弥补这个问题,一些研究者采用长短时记忆神经网络来做文本情感分析,有效利用了文本的上下文信息和长时间的前后时序信息。但是有些复杂的文本中可能会存在多种情感倾向,如何得到一个正确的情感分类结果便成为了文本情感分类的难点。因此,如何利用深度学习模型获取一段文本的最有效、最综合、最全面的分布式表示,是影响文本情感分析效果的一个重要因素。
发明内容
针对现有技术的不足,本发明提供了一种基于张量融合方式的情感分类的方法;
本发明主要是针对存在多情感倾向问题的情感分类,由于数据集中每一段文本都包含有三句话,利用双向LSTM对每一句话提取特征,获取每一句的情感特征向量,采用张量融合的方式,将每一个特征向量进行有效的融合,形成一个总的联合特征表示送往分类器进行分类。
该模型完全适用于存在多情感倾向的情感分类问题,克服了传统做法中需要提前识别目标词的缺点,也不需要借助其他的自然语言处理工具,算法简单,效果显著。同时,该模型采用了张量融合的方式,充分利用了数据本身的信息,利用模型去除冗余信息,保留并利用有用信息,做到了信息利用率的最大化。
术语解释:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811441312.0/2.html,转载请声明来源钻瓜专利网。