[发明专利]基于图卷积神经网络的视角级文本情感分类方法及系统在审
申请号: | 202110913656.2 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113641820A | 公开(公告)日: | 2021-11-12 |
发明(设计)人: | 廖祥文;曾梦美;郭星宇;朱雨航;张纬峰 | 申请(专利权)人: | 福州大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/30;G06N3/04 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 陈鼎桂;蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 图卷 神经网络 视角 文本 情感 分类 方法 系统 | ||
1.一种基于图卷积神经网络的视角级文本情感分类方法,其特征在于,包括以下步骤:
步骤S1:获取待分类文本数据,并进行预处理;
步骤S2:采用BiLSTM捕获预处理后文本数据的双向语义依赖关系;
步骤S3:采用多头自注意力机制来捕获文本单词序列的全局内部相关性,并通过逐点卷积变换,进一步进行信息整合;
步骤S4:将GCN直接作用于句子依存关系树来建模句子结构,将视角词附近的知识信息聚合到视角词,再屏蔽掉非视角词的隐藏状态向量,通过平均池化操作来保留视角词向量中的信息,得到最终的文本情感特征向量表示;
步骤S5:采用softmax函数对得到的最终的文本情感特征向量表示进行处理,将概率最大的类别作为该文本表示的情感类别预测值。
2.根据权利要求1所述的基于图卷积神经网络的视角级文本情感分类方法,其特征在于,所述步骤S1具体为:
步骤S11:对待分类文本数据进行分词处理,接着通过Glove将文本数据从文本形式映射成低维稠密向量;
步骤S12:采用斯坦福的句法分析器对文档中的句子进行依存句法分析并进行词性标注;
步骤S13:将通过Glove得到的词嵌入向量与词性标签嵌入向量以及位置嵌入向量拼接起来作为初始文本向量。
3.根据权利要求1所述的基于图卷积神经网络的视角级文本情感分类方法,其特征在于,所述步骤S3具体为:通过以下公式计算多头自注意力机制的输出Hintra:
Hintra=MHA(H*,H*);
式中,H*表示BiLSTM的输出,;表示向量连接,表示第i个注意力头的输出,Wmh表示待学习的权重参数矩阵;
通过以下公式计算注意力头的输出:
Attention(k,q)=softmax(fs(k,q))k;
fs(ki,qj)=tanh([ki;qj]·Watt);
式中,fs表示学习ki和qj之间语义相关性的得分函数,Watt表示待学习的权重参数矩阵;
逐点卷积变换(PCT)可以变换多头自注意力收集到的上下文信息;逐点卷积变换的计算公式如下:
式中,σ(·)表示ELU激活函数,*表示卷积运算,表示两个卷积核待学习的权重参数矩阵,表示两个卷积核待学习的权重参数向量;
将逐点卷积变换应用于多头自注意力的输出Hintra,得到向量表示Hc:
Hc=PCT(Hintra);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110913656.2/1.html,转载请声明来源钻瓜专利网。