[发明专利]基于图卷积网络的社交网络文本情感细粒度分类方法有效
| 申请号: | 201910728633.7 | 申请日: | 2019-08-08 |
| 公开(公告)号: | CN110472003B | 公开(公告)日: | 2022-02-22 |
| 发明(设计)人: | 张林峰;韩东红;赖裕妮;刘晓倩;王旭;赵帅 | 申请(专利权)人: | 东北大学 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/35;G06Q50/00 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明提供一种基于图卷积网络的社交网络文本情感细粒度分类方法,涉及自然语言处理(NLP)中检测文本作者情感极性的领域。本发明对于社交网络文本上的愤怒、厌恶、恐惧、快乐、喜欢、悲伤和惊讶等情绪进行分类,建立了一种基于语法的细粒度情感检测图形卷积网络(GCN)模型。该模型采用BI‑LSTM网络对给定文本进行初步特征提取,将句子图的初步特征和邻接矩阵输入到一个单层GCN中,以利用句子的句法结构,最后得到池化层或全连接层的概率分布。用BI‑LSTM网络与GCN相结合,增强了模型对汉语文本不同语法结构的理解,提高了模型的鲁棒性,提出的基于百分位数的池化方法提高了模型的精确度。 | ||
| 搜索关键词: | 基于 图卷 网络 社交 文本 情感 细粒度 分类 方法 | ||
【主权项】:
1.一种基于图卷积网络的社交网络文本情感细粒度分类方法,其特征在于:包括以下步骤:/n步骤1:对给定的社交网络文本进行预处理,清除文本中不必要内容,对语句进行划分转化;/n步骤2:将BI-LSTM神经网络算法应用于进行预处理之后的社交网络文本词序列后,可以得到前向和后向矢量序列,将这两个向量连接起来得到单词序列的基本表示;/n所述BI-LSTM神经网络算法的输出向量和语法依赖树将作为GCN网络的输入;/n步骤3:建立GCN神经网络,在边集中增加自环和对边,根据步骤2生成的依赖树,为每个社交网络文本创建稀疏邻接矩阵;/n步骤4:用基于百分位数的池化方法表示元素升序排序集合后的最低p%的值,将向量Z的第p个百分位数表示为一个函数fp(z),其中p值的范围为0-100;/n步骤5:使用正交化约束来控制梯度的消失和爆炸问题,在损失函数中添加一个正则化项,loss=loss(y,fw(x))+λ∑i||WiTWi-I||2,其中λ是惩罚系数,Wi是权重矩阵,I是单位矩阵,在LSTM和GCN神经网络中使用正交矩阵来初始化权值矩阵,在随机初始化的矩阵M上使用奇异值分解(SVD),得到M=USVT,其中U和V是正交矩阵,S是对角谱矩阵,U或V可用于初始化权重矩阵w,即W:=U。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910728633.7/,转载请声明来源钻瓜专利网。





