[发明专利]一种基于深度学习的多层次中文细粒度情感分析方法在审
申请号: | 202110373336.2 | 申请日: | 2021-04-07 |
公开(公告)号: | CN112861524A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 邓文卓;张祖平 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F40/247 | 分类号: | G06F40/247;G06F40/30;G06K9/62;G06N3/08 |
代理公司: | 长沙七源专利代理事务所(普通合伙) 43214 | 代理人: | 张勇;刘伊旸 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 多层次 中文 细粒度 情感 分析 方法 | ||
1.一种基于深度学习的多层次中文细粒度情感分析方法,其特征在于:构建一种基于BERT模型生成的动态字向量以及word2vec方法生成的静态词向量的双通道输入,结合中文字向量和词向量两个层面从而获取更丰富的特征,并使用深度学习的方法进行中文细粒度情感分析,所述方法包括以下步骤:
步骤1:构建训练集,采用回译数据增强以及同义词替换的方式增加文本情感标签的均衡性及多样性;
步骤2:使用BERT模型微调对输入文本进行字嵌入表示以及使用word2vec技术对输入文本进行词嵌入表示;
步骤3:设计双卷积通道分别抽取字向量和词向量两个层面的特征表示;
步骤4:在每个卷积通道后都构建chunk-max-pooling模块抽取局部max特征值并保留相对顺序信息;
步骤5:将两个通道池化后的特征向量拼接并输入全连接层使用softmax模块进行细粒度情感分类。
2.据权利要求1所述的基于深度学习的多层次中文细粒度情感分析方法,其特征在于:步骤1中首先分析训练集标签样本的分布情况,然后使用回译数据增强以及同义词替换增加文本数据的多样性。
3.据权利要求1所述的基于深度学习的多层次中文细粒度情感分析方法,其特征在于:步骤2中使用预训练的BERT模型对目标预料进行微调,然后对输入文本进行字层面的嵌入,得到动态字向量,以word2vec为基础,对输入文本进行词层面的嵌入,得到静态词向量;上述两步得到模型的双通道输入,分别输入后续的CNN网络中。
4.据权利要求1所述的基于深度学习的多层次中文细粒度情感分析方法,其特征在于:步骤3中每个卷积通道都使用多个大小不同的卷积核进行计算以获取不同长度的字向量组合信息以及词向量组合信息;步骤4中使用chunk-max-pooling池化方法保留多个局部max特征值的相对顺序信息,从而提取并突出局部语义信息。
5.据权利要求1所述的基于深度学习的多层次中文细粒度情感分析方法,其特征在于:步骤5中将双通道中池化后的向量拼接在一起,组成多层次的特征图,并通过全连接层经由softmax完成细粒度情感分类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110373336.2/1.html,转载请声明来源钻瓜专利网。