[发明专利]一种情感分类方法、装置、电子设备和存储介质在审
| 申请号: | 201911199692.6 | 申请日: | 2019-11-29 |
| 公开(公告)号: | CN112883188A | 公开(公告)日: | 2021-06-01 |
| 发明(设计)人: | 梁天新;王炳乾 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35 |
| 代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李莎 |
| 地址: | 100015 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 情感 分类 方法 装置 电子设备 存储 介质 | ||
本发明提供一种情感分类方法、装置、电子设备和存储介质,包括:通过训练集训练串行的自然语言预训练模型和文本分类模型,得到情感分类组合模型;其中,所述训练集包括多个训练样本,每个训练样本包括文本、所述文本中的方面词和所述方面词的分类标签;将待预测文本和所述待预测文本中的方面词输入到所述情感分类组合模型中,以输出所述待预测文本中的方面词的分类标签。本发明将自然语言预训练模型和文本分类模型串行组合,通过训练集训练这两个模型,训练后的组合模型能够实现基于方面词的细粒度情感分类,从而准确地对文本进行细粒度情感分析。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种情感分类方法、装置、电子设备和存储介质。
背景技术
随着社交网络的兴起,越来越多的人喜欢在网络上发表自己的观点,这种带有个人主观态度的文本具有很大的挖掘价值。因为用户需求的不断增加,句子级别的情感分析只能给出一整句话的情感值,无法准确表达用户想要知道的对象,所以情感分析粒度需要更加细化。但是,现有的情感分析方法无法准确地对文本进行细粒度情感分析。
发明内容
有鉴于此,本发明的目的在于提出一种情感分类方法、装置、电子设备和存储介质,以解决细粒度情感分类不够准确的技术问题。
基于上述目的,根据本发明的第一个方面,其提供了一种情感分类方法,包括:
通过训练集训练串行的自然语言预训练模型和文本分类模型,得到情感分类组合模型;其中,所述训练集包括多个训练样本,每个训练样本包括文本、所述文本中的方面词和所述方面词的分类标签;
将待预测文本和所述待预测文本中的方面词输入到所述情感分类组合模型中,以输出所述待预测文本中的方面词的分类标签。
在本发明的一些实施例中,通过训练集训练串行的自然语言预训练模型和文本分类模型,得到情感分类组合模型,包括:
将训练集输入到自然语言预训练模型中,得到所述自然语言预训练模型输出的第一语义特征向量;
将所述自然语言预训练模型输出的第一语义特征向量输入到文本分类模型中,得到所述文本分类模型输出的第二语义特征向量;
根据所述文本分类模型输出的第二语义特征向量优化所述自然语言预训练模型的参数和所述文本分类模型的参数,从而得到情感分类组合模型。
在本发明的一些实施例中,根据所述文本分类模型输出的第二语义特征向量优化所述自然语言预训练模型的参数和所述文本分类模型的参数,从而得到情感分类组合模型,包括:
基于所述文本分类模型输出的第二语义特征向量、所述自然语言预训练模型的参数和所述文本分类模型的参数,计算损失函数;
通过使所述损失函数取最小值,获得所述自然语言预训练模型的最优参数和所述文本分类模型的最优参数,从而得到情感分类组合模型。
在本发明的一些实施例中,所述损失函数为交叉熵损失函数。
在本发明的一些实施例中,所述自然语言预训练模型为BERT模型,和/或,所述文本分类模型为TextCNN模型。
根据本发明的第二个方面,其提供了一种情感分类装置,包括:
训练模块,被配置为:通过训练集训练串行的自然语言预训练模型和文本分类模型,得到情感分类组合模型;其中,所述训练集包括多个训练样本,每个训练样本包括文本、所述文本中的方面词和所述方面词的分类标签;
预测模块,被配置为:将待预测文本和所述待预测文本中的方面词输入到所述情感分类组合模型中,以输出所述待预测文本中的方面词的分类标签。
在本发明的一些实施例中,所述训练模块还用于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911199692.6/2.html,转载请声明来源钻瓜专利网。





