[发明专利]一种基于深度学习的多层次中文细粒度情感分析方法在审
申请号: | 202110373336.2 | 申请日: | 2021-04-07 |
公开(公告)号: | CN112861524A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 邓文卓;张祖平 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/30;G06K9/62;G06N3/08 |
代理公司: | 长沙七源专利代理事务所(普通合伙) 43214 | 代理人: | 张勇;刘伊旸 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 多层次 中文 细粒度 情感 分析 方法 | ||
本发明公开了一种基于深度学习的多层次中文细粒度情感分析方法,此方法可以通过快速准确地识别中文文本中细粒度的情感类别,从而更加精细化地理解用户的主观感受,从而预测用户行为并改善用户体验。其主要包括:步骤1,构建训练集,采用回译数据增强以及同义词替换的方式增加文本情感标签的均衡性及多样性;步骤2,使用BERT模型微调对输入文本进行字嵌入表示以及使用word2vec技术对输入文本进行词嵌入表示;步骤3,设计多层次卷积神经网络模型(Multi‑LevelConvolutionalNeuralNetwork,MLCNN),使用双卷积通道分别抽取字向量和词向量两个层面的特征表示;步骤4,在每个卷积通道后都构建chunk‑max‑pooling模块抽取局部max特征值并保留相对顺序信息;步骤5,将两个通道池化后的特征向量拼接并输入全连接层使用softmax模块进行细粒度情感分类。
技术领域
本发明涉及自然语言处理的文本情感分析领域,具体地说,是涉及基于深度学习的多层次中文细粒度情感分析方法。
背景技术
情感分析技术(Emotion analysis technology)又称意见挖掘、倾向性分析等,是将文本中包含用户主观色彩的偏好或倾向识别出来的过程,并根据识别出来的结果根据后续不同的任务进一步获取有用的信息,从而发现潜在的问题用于改进或预测。现阶段情感极性分析(粗粒度情感分析)的研究已经有了成熟的研究体系,但是人类情感无法仅用两类来完全概括,细粒度情感分析的研究因此被提出。细粒度情感分析需要更加深入地挖掘文本中包含的情感信息,并由此更加精细化地理解用户的主观感受,从而预测用户行为并改善用户体验。目前,最精确的细粒度情感分析方法就是人工识别,但是人工识别的方法在数据量大的情况下不适用,除此之外较普遍的方法是基于情绪规则,但该方法依赖前期情绪词典的构建,若文本中情绪词不明显将会难以分析出真实情感。本发明将深度学习技术应用于细粒度情感分析中,首先构建了包含各类情感的中文文本的数据集,并提出了一种使用字嵌入及词嵌入双通道输入的文本向量表示方法,然后基于双通道输入提出了基于深度学习的多层次卷积神经网络模型(Multi-Level Convolutional Neural Network,MLCNN)来识别中文文本的细粒度情感,该模型不需要人工制定情绪词典和规则,并且还可以根据多层面的文本向量更好地分析出文本中包含的细粒度情感。
发明内容
基于中文细粒度情感分类困难的现状,本发明针对目前现有技术,提出了一种基于深度学习的多层次中文短文本细粒度情感分析方法,用来提高中文细粒度情感分析的效率和准确性。
本发明提出了一种基于深度学习的多层次中文细粒度情感分析方法,其主要包括以下步骤:
步骤1:构建训练集,采用回译数据增强以及同义词替换的方式增加文本情感标签的均衡性及多样性;
步骤2:使用BERT模型微调对输入文本进行字嵌入表示以及使用word2vec技术对输入文本进行词嵌入表示;
步骤3:设计多层次卷积神经网络模型(Multi-Level ConvolutionalNeuralNetwork,MLCNN),使用双卷积通道分别抽取字向量和词向量两个层面的特征表示;
步骤4:在每个卷积通道后都构建chunk-max-pooling模块抽取局部max特征值并保留相对顺序信息;
步骤5:将两个通道池化后的特征向量拼接并输入全连接层使用softmax模块进行细粒度情感分类。
附图说明
为了更加清晰明确地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要用到的附图进行简单的介绍。
图1是本发明提供的基于深度学习的多层次中文细粒度情感分析方法的整体架构;
图2是本发明提供的双通道文本向量表示示例图;
图3是本发明提供的多层次卷积神经网络模型框架图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110373336.2/2.html,转载请声明来源钻瓜专利网。