[发明专利]基于图卷积网络的社交网络文本情感细粒度分类方法有效
| 申请号: | 201910728633.7 | 申请日: | 2019-08-08 |
| 公开(公告)号: | CN110472003B | 公开(公告)日: | 2022-02-22 |
| 发明(设计)人: | 张林峰;韩东红;赖裕妮;刘晓倩;王旭;赵帅 | 申请(专利权)人: | 东北大学 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/35;G06Q50/00 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
| 地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图卷 网络 社交 文本 情感 细粒度 分类 方法 | ||
本发明提供一种基于图卷积网络的社交网络文本情感细粒度分类方法,涉及自然语言处理(NLP)中检测文本作者情感极性的领域。本发明对于社交网络文本上的愤怒、厌恶、恐惧、快乐、喜欢、悲伤和惊讶等情绪进行分类,建立了一种基于语法的细粒度情感检测图形卷积网络(GCN)模型。该模型采用BI‑LSTM网络对给定文本进行初步特征提取,将句子图的初步特征和邻接矩阵输入到一个单层GCN中,以利用句子的句法结构,最后得到池化层或全连接层的概率分布。用BI‑LSTM网络与GCN相结合,增强了模型对汉语文本不同语法结构的理解,提高了模型的鲁棒性,提出的基于百分位数的池化方法提高了模型的精确度。
技术领域
本发明涉及自然语言处理(NLP)中检测文本作者情感极性的领域,尤其涉及基于图卷积网络的社交网络文本情感细粒度分类方法。
背景技术
随着互联网的快速发展,人们对社交网络的使用越来越密集,从而产生了海量的文本数据。人们借助聊天室、个人日志、朋友圈、微博等社交网络平台,自由公开表达自己的思想、情感,与他人交流观点、看法,形成正式或非正式的社交网络,其中蕴含了人类丰富的心理和行为信息。如何挖掘社交网络文本情感并充分利用,成为相关研究领域的热点问题,为社会科学的发展带来了前所未有的机遇,推动了计算社会科学等交叉学科的诞生。与此同时,在线文本分析技术为挖掘和分析互联网上的海量信息,提供了技术支持与保证。
传统的在线文本分析大多基于客观要素,如根据研究的主题对信息进行分类,而忽视了其中所蕴含的主观要素,比如情感信息。近年来,对在线文本的情感分析成为信息科学的研究热点。而情绪、情感一直是心理学的研究重点,心理学关于情绪、情感的研究成果,对于挖掘和分析网络信息具有重要的参考价值。越来越多的信息科学学者意识到这一点,不仅在传统的情感分析工具中加入一些心理学元素,而且还根据心理学的情绪结构理论构建了多个全新的研究工具,为在线文本的情感分析注入了心理学思想。利用这些研究工具对在线文本进行情感分析,已取得诸多有价值的研究成果。
随着科学研究的不断深入发展,细粒度的情感提取日显重要。从近年来的研究中可以发现,对社交网络的研究主要集中在微博,国内学者目前对情感分类研究普遍集中在粗粒度分类上。常见粗粒度的情感分类比如有无情感判断,积极与消极情绪分类,而这对于精确的科学研究或社会学研究是远远不够的。实际上,如果能对积极和消极的粗分类再做细致一些的分析,将积极情感细分为惊讶、喜爱、高兴,将消极情感细分为哀伤、厌恶、愤怒、恐惧,那将对社交网络文本的情感挖掘产生十分积极的意义。目前,文本情感的细粒度分类的效果仍不理想,由于以汉语为代表的亚洲语言与使用字母单词的印欧语系天然差异,许多在英语中表现良好的算法在汉语中并不令人满意,这也对中文文本情感分类提出了挑战。
随着社交网络数据量不断扩大和丰富,跨领域社交网络情感分析的具有重要的意义。信息技术的发展使人们获取知识的途径越来算法越多,速度越来越快,但是信息处理能力却没有得到相应的提高。作为数据挖掘、知识发现的重要手段之一,机器学习一直受到广泛的关注,但是由于其严格的假设条件,给实际应用带来了很多困难,如常会导致训练数据过期、训练模型过期、标记训练样本成本过高等问题,大大降低了数据分析的效率,使得机器学习在实际的应用当中受到了限制。从实际应用的角度出发,我们希望利用已有的信息,在有限的条件下尽可能地提高学习效率。对大部分实际应用来说,就是如何解决利用其它领域的数据帮助目标任务中的机器学习任务,进行跨领域学习的问题。近年来,受到人类学习过程的启发,迁移学习的模式被引入到机器学习当中。由于放松了学习过程中对训练数据和测试数据同分布假设的要求,能够利用相领域的知识来帮助目标领域中的学习任务,迁移学习能够有效解决跨领域学习的问题。目前,迁移学习受到很多学者的关注,成为机器学习研究领域中的热点。加强迁移学习理论和方法的研究,对进一步改善机器学习的效率、提高己有算法的性能和增强算法的实用性具有重要的意义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910728633.7/2.html,转载请声明来源钻瓜专利网。





