[发明专利]基于图卷积网络的社交网络文本情感细粒度分类方法有效

专利信息
申请号: 201910728633.7 申请日: 2019-08-08
公开(公告)号: CN110472003B 公开(公告)日: 2022-02-22
发明(设计)人: 张林峰;韩东红;赖裕妮;刘晓倩;王旭;赵帅 申请(专利权)人: 东北大学
主分类号: G06F16/31 分类号: G06F16/31;G06F16/33;G06F16/35;G06Q50/00
代理公司: 沈阳东大知识产权代理有限公司 21109 代理人: 李在川
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于图卷积网络的社交网络文本情感细粒度分类方法,涉及自然语言处理(NLP)中检测文本作者情感极性的领域。本发明对于社交网络文本上的愤怒、厌恶、恐惧、快乐、喜欢、悲伤和惊讶等情绪进行分类,建立了一种基于语法的细粒度情感检测图形卷积网络(GCN)模型。该模型采用BI‑LSTM网络对给定文本进行初步特征提取,将句子图的初步特征和邻接矩阵输入到一个单层GCN中,以利用句子的句法结构,最后得到池化层或全连接层的概率分布。用BI‑LSTM网络与GCN相结合,增强了模型对汉语文本不同语法结构的理解,提高了模型的鲁棒性,提出的基于百分位数的池化方法提高了模型的精确度。
搜索关键词: 基于 图卷 网络 社交 文本 情感 细粒度 分类 方法
【主权项】:
1.一种基于图卷积网络的社交网络文本情感细粒度分类方法,其特征在于:包括以下步骤:/n步骤1:对给定的社交网络文本进行预处理,清除文本中不必要内容,对语句进行划分转化;/n步骤2:将BI-LSTM神经网络算法应用于进行预处理之后的社交网络文本词序列后,可以得到前向和后向矢量序列,将这两个向量连接起来得到单词序列的基本表示;/n所述BI-LSTM神经网络算法的输出向量和语法依赖树将作为GCN网络的输入;/n步骤3:建立GCN神经网络,在边集中增加自环和对边,根据步骤2生成的依赖树,为每个社交网络文本创建稀疏邻接矩阵;/n步骤4:用基于百分位数的池化方法表示元素升序排序集合后的最低p%的值,将向量Z的第p个百分位数表示为一个函数fp(z),其中p值的范围为0-100;/n步骤5:使用正交化约束来控制梯度的消失和爆炸问题,在损失函数中添加一个正则化项,loss=loss(y,fw(x))+λ∑i||WiTWi-I||2,其中λ是惩罚系数,Wi是权重矩阵,I是单位矩阵,在LSTM和GCN神经网络中使用正交矩阵来初始化权值矩阵,在随机初始化的矩阵M上使用奇异值分解(SVD),得到M=USVT,其中U和V是正交矩阵,S是对角谱矩阵,U或V可用于初始化权重矩阵w,即W:=U。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910728633.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top