[发明专利]基于图卷积神经网络的视角级文本情感分类方法及系统在审
申请号: | 202110913656.2 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113641820A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 廖祥文;曾梦美;郭星宇;朱雨航;张纬峰 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/30;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈鼎桂;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 神经网络 视角 文本 情感 分类 方法 系统 | ||
本发明涉及一种基于图卷积神经网络的视角级文本情感分类系统及方法,包括:文本预处理模块,用于对视角级文本进行特征化处理;文本语义信息获取模块,用于捕获文本的双向语义依赖关系;注意力编码模块,用于捕获文本单词序列的全局内部相关性,并进行进一步信息整合;图卷积神经网络模块,将GCN直接作用于句子依存关系树来建模句子结构,可将上下文和依赖信息从观点词传播到视角词;情感类别输出模块,用分类函数得到文本最终的情感分类结果。本发明可以有效发挥图卷积网络的作用,能够利用图卷积神经网络通过语义依赖树来建模句子结构,得到更好的文本情感特征表示。
技术领域
本发明涉及文本分析领域,具体涉及一种基于图卷积神经网络的视角级文本情感分类方法及系统。
背景技术
以往的情感分析对象以句子或文档为主,并取得了很好的成果,但是在真实的应用场景中一段文本的情感简单使用(积极、消极和中立)无法准确表达文本的真实情感。以评论“这个手机价格很便宜,但是像素不高”为例,该评论是对一个手机进行了整体描述,但是从文档级或句子级做情感分析,无法判别评论的情感极性。视角级文本情感分析是情感分析中的一项细粒度任务,旨在研究每个视角词在文本中所表达的情感极性。上述评论对于两个不同的视角词“价格”和“像素”,所表现出来的情感极性分别是积极和消极。视角级文本情感分析可以准确把握用户针对不同方面的情感信息,能够提供比文档级或句子级更全面、更深入的分析。于是视角级文本情感分析逐渐受到了广泛关注,成为研究热点之一。
发明内容
有鉴于此,本发明的目的在于提供一种基于图卷积神经网络的视角级文本情感分类方法及系统,能够对视角级文本进行特征化处理,并从文本中提取语义特征,然后通过多层图卷积神经网络,得到最终的分类结果。
为实现上述目的,本发明采用如下技术方案:
一种基于图卷积神经网络的视角级文本情感分类方法,包括以下步骤:
步骤S1:获取待分类文本数据,并进行预处理;
步骤S2:采用BiLSTM捕获预处理后文本数据的双向语义依赖关系;
步骤S3:采用多头自注意力机制来捕获文本单词序列的全局内部相关性,并通过逐点卷积变换,进一步进行信息整合;
步骤S4:将GCN直接作用于句子依存关系树来建模句子结构,将视角词附近的知识信息聚合到视角词,再屏蔽掉非视角词的隐藏状态向量,通过平均池化操作来保留视角词向量中的信息,得到最终的文本情感特征向量表示;
步骤S5:采用softmax函数对得到的最终的文本情感特征向量表示进行处理,将概率最大的类别作为该文本表示的情感类别预测值。
进一步的,所述步骤S1具体为:
步骤S11:对待分类文本数据进行分词处理,接着通过Glove将文本数据从文本形式映射成低维稠密向量;
步骤S12:采用斯坦福的句法分析器对文档中的句子进行依存句法分析并进行词性标注;
步骤S13:将通过Glove得到的词嵌入向量与词性标签嵌入向量以及位置嵌入向量拼接起来作为初始文本向量。
进一步的,所述步骤S3具体为:通过以下公式计算多头自注意力机制的输出Hintra:
Hintra=MHA(H*,H*);
式中,H*表示BiLSTM的输出,;表示向量连接,表示第i个注意力头的输出,Wmh表示待学习的权重参数矩阵;
通过以下公式计算注意力头的输出:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110913656.2/2.html,转载请声明来源钻瓜专利网。