[发明专利]文本情感分类方法、装置、电子设备及可读存储介质有效
| 申请号: | 201910443387.0 | 申请日: | 2019-05-24 |
| 公开(公告)号: | CN110222178B | 公开(公告)日: | 2021-11-09 |
| 发明(设计)人: | 刘玉茹 | 申请(专利权)人: | 新华三大数据技术有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/30;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 北京超成律师事务所 11646 | 代理人: | 邓超 |
| 地址: | 450000 河南省郑州市郑州高新*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 情感 分类 方法 装置 电子设备 可读 存储 介质 | ||
本申请实施例提供一种文本情感分类方法、装置、电子设备及可读存储介质,该方法包括:获取待分类的目标文本中的目标关键词对应的目标词向量;通过第一Bi‑LSTM层对目标词向量的句法特征进行提取,输出表征句法特征的目标句法特征向量;通过第二Bi‑LSTM层对目标句法特征向量的语义特征进行提取,输出表征语义特征的目标语义特征向量;通过分类层基于目标词向量、目标句法特征向量以及目标语义特征向量确定目标文本对应的情感类别。由于本申请中可以提取目标关键词的句法特征以及语义特征,使得获取的信息可以更加全面,可以更加深入理解目标文本的内在含义,所以可有效提高分类结果的准确性。
技术领域
本申请涉及语言理解技术领域,具体而言,涉及一种文本情感分类方法、装置、电子设备及可读存储介质。
背景技术
随着互联网技术的快速发展,越来越多的用户喜欢在社交平台发布自己的观点、态度和看法,从而网络上产生大量用户针对热点事件、产品等有价值的文本信息。这些文本信息包含用户丰富的情感色彩和情感倾向,情感分析的目的就是自动从文本中提取和分类用户的主观情感信息,以了解大众对某一事件或产品的看法。
目前一般采用机器学习方法对文本进行情感类别识别,其通常是将提取的文本的相关特征之间输入至分类器中,通过分类器基于这些特征来对文本进行情感类别分类,但是其通常提取的特征中可能包含的信息并不全面,从而使得分类结果准确性较低。
发明内容
有鉴于此,本申请实施例的目的在于提供一种文本情感分类方法、装置、电子设备及可读存储介质,以改善现有技术中对文本进行情感类别分类准确性低的问题。
第一方面,本申请实施例提供了一种文本情感分类方法,用于通过双向循环神经网络Bi-LSTM模型对文本进行情感分类,所述Bi-LSTM模型包括:第一Bi-LSTM层、第二Bi-LSTM层以及分类层,所述方法包括:获取待分类的目标文本中的目标关键词对应的目标词向量;将所述目标词向量输入到所述第一Bi-LSTM层,通过所述第一Bi-LSTM层对所述目标词向量的句法特征进行提取,输出表征所述句法特征的目标句法特征向量,其中,所述句法特征用于表征所述目标关键词在所述目标文本中的上下文信息;通过所述第二Bi-LSTM层对所述目标句法特征向量的语义特征进行提取,输出表征所述语义特征的目标语义特征向量,其中,所述语义特征用于表征所述目标关键词在所述目标文本中的语义信息;通过所述分类层基于所述目标词向量、所述目标句法特征向量以及所述目标语义特征向量确定所述目标文本对应的情感类别。
在上述实现过程中,通过Bi-LSTM模型中的第一Bi-LSTM层来提取句法特征,通过第二Bi-LSTM层来提取语义特征,然后将两层的输出以及输入的词向量均输入分类层,再通过分类层基于句法特征向量、语义特征向量以及输入的词向量来确定目标文本的情感类别,由于本申请中可以提取目标关键词的句法特征以及语义特征,所以使得获取的信息可以更加全面,从而可以更加深入理解目标文本的内在含义,进而有效提高分类结果的准确性。
可选地,所述通过所述分类层基于所述目标词向量、所述目标句法特征向量以及所述目标语义特征向量确定所述目标文本对应的情感类别,包括:通过所述分类层将所述目标词向量、所述目标句法特征向量以及所述目标语义特征向量进行加权,获得加权向量;通过所述分类层基于所述加权向量预测所述目标文本对应的各个情感类别的概率值;通过所述分类层根据所述目标文本对应的各个情感类别的概率值确定所述目标文本对应的情感类别。
在上述实现过程中,将获得的目标句法特征向量、目标语义特征向量以及目标词向量进行加权后获得加权向量,在进行加权时,可将各个向量乘以不同的权重,以区分不同向量对情感类别预测的影响大小,从而使得在基于加权向量确定目标文本对应的情感类别时,可以更为准确的预测目标文本对应的各个情感类别的概率值。
可选地,所述通过所述分类层根据所述目标文本对应的各个情感类别的概率值确定所述目标文本对应的情感类别,包括:通过所述分类层将所述目标文本对应的各个情感类别的概率值中概率值最大的情感类别确定为所述目标文本对应的情感类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910443387.0/2.html,转载请声明来源钻瓜专利网。





