[发明专利]一种融合情感词典的情感分析方法及装置在审
申请号: | 202110346235.6 | 申请日: | 2021-03-31 |
公开(公告)号: | CN112860901A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 孔繁爽;李策;江林格 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 情感 词典 分析 方法 装置 | ||
本发明提供了一种融合情感词典的情感分析方法及装置,可以应用于人工智能领域,包括:将获取的源领域中的句子与目标领域中的句子输入预先生成的编码器中获得源领域句子词向量与目标领域句子词向量;将源领域词向量与目标领域句子词向量输入句子向量编码器分别获得源领域句子表征和目标领域句子表征;利用源领域句子表征和目标领域句子表征获得目标领域的情感分类结果。本申请以情感词为预测目标,通过语言模型将源领域与目标领域的语料进行联合训练,生成一个能够提取情感分析相关特征的编码器,进而使用词编码器生成待情感分类文本的特征向量,实现了使用较少或不使用标注数据即可获得可用分类结果的技术效果。
技术领域
本申请属于自然语言处理技术领域,具体地讲,涉及一种融合情感词典的情感分析方法及装置。
背景技术
随着深度学习模型在自然语言处理领域的广泛应用,文本情感分析结果的准确性也有了很大的提升,当前,深度学习模型已被用于分析商品评论和舆情等。在金融业中,通过有效分析与法人客户相关的时事新闻,判断大众对该法人的情感指数,对于银行的信贷风控具有重大意义。针对法人客户舆论的情感分析能够为银行监测法人客户风险情况时提供辅助决策支持。但是,目前针对情感分类的开源标注数据大多来自互联网公司的商品评论、服务评论,针对金融领域新闻的训练样本数据较少,所以对财经新闻的情感分析模型提出了更高的要求,为了取得较好的情感分类结果,需要人工标注部分数据作为训练数据集,造成人力资源浪费。
发明内容
本申请提供了一种融合情感词典的情感分析方法及装置,以至少解决如何在开源标注数据量少的情况下,无需对数据进行标注即可取得情感分类结果的问题。
根据本申请的一个方面,提供了一种融合情感词典的情感分析方法,包括:
将获取的源领域中的句子与目标领域中的句子输入预先生成的编码器中获得源领域句子词向量与目标领域句子词向量;
将源领域词向量与目标领域句子词向量输入句子向量编码器分别获得源领域句子表征和目标领域句子表征;
利用源领域句子表征和目标领域句子表征获得目标领域的情感分类结果。
在一实施例中,利用源领域句子表征和目标领域句子表征获得目标领域的情感分类结果,包括:
利用带有标注的源领域句子表征对情感分类器进行训练,获得训练后的情感分类器;
通过训练后的情感分类器对无标注的目标领域句子表征进行情感分类获得目标领域的情感分类结果。
在一实施例中,句子向量编码器为长短期记忆网络编码器。
在一实施例中,情感分类器为MLP多层感知机。
在一实施例中,编码器的生成过程包括:
获取源领域的情感词典目标领域的情感词典;
将句子中出现的情感词典中的情感词进行模糊处理;
利用模糊后的句子通过语言模型训练词向量,获得能够提取情感特征的编码器。
在一实施例中,融合情感词典的情感分析方法还包括:
利用Adam优化器对编码器进行优化获得优化后的编码器。
根据本申请的另一个方面,还提供了一种融合情感词典的情感分析装置,包括:
词向量获取单元,用于将获取的源领域中的句子与目标领域中的句子输入预先生成的编码器中获得源领域句子词向量与目标领域句子词向量;
句子表征获取单元,用于将源领域词向量与目标领域句子词向量输入句子向量编码器分别获得源领域句子表征和目标领域句子表征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110346235.6/2.html,转载请声明来源钻瓜专利网。