[发明专利]一种情感分析模型训练优化方法、系统和存储介质在审
申请号: | 202110236422.9 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113076753A | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 辛永欣 | 申请(专利权)人: | 山东英信计算机技术有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 情感 分析 模型 训练 优化 方法 系统 存储 介质 | ||
本发明公开了一种情感分析模型训练优化方法,包括如下步骤:第一步,获取文本和情感标签,并输入模型的自注意力机制模块;第二步,通过自注意力机制模块将文本和情感标签进行特征融合,得到融合表示标识;第三步,将融合表示标识输入模型的多层感知器模块并进行计算,得到文本和情感标签的匹配度;基于匹配度优化损失函数使模型达到收敛状态,得到优化模型;第四步,通过优化模型对输入的待预测文本进行情感分析操作;通过上述方式,本发明实现了对文本的情感分析,提高了分析准确度。
技术领域
本发明涉及情感分析技术领域,特别是涉及一种情感分析模型训练优化方法、系统和存储介质。
背景技术
情感分析(Sentiment Analysis)是指利用自然语言处理和挖掘文本技术,对带有情感色彩的主观性文本进行分析、处理和抽取的过程;目前,文本情感分析研究涵盖了包括自然语言处理、文本挖掘、信息检索、信息抽取、机器学习和本体学等多个领域,得到了许多学者以及研究机构的关注,近几年持续成为自然语言处理和文本挖掘领域研究的热点问题之一。
现在情感分析解决方案大多是将其视为一个多分类任务,即输入待分析文本后,经过BERT模型将句子表示成一个向量,然后基于该向量进行多分类预测,输出正向、中性和负向情感的概率,最后取概率最高的情感类别做为输出类别;现有技术的缺陷在于,在表示阶段仅仅使用输入文本信息,情感标签只在最后输出层做为概率计算的依据,缺乏情感标签的表示,导致情感分析不够准确。
发明内容
本发明主要解决的技术问题是提供一种情感分析模型训练优化方法、系统和存储介质,能够解决缺乏情感标签的表示,导致情感分析不够准确的问题。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种情感分析模型训练优化方法,模型包括自注意力机制模块和多层感知器模块,所述方法包括如下步骤:
第一步,获取文本和情感标签,并输入所述模型的所述自注意力机制模块;
第二步,通过所述自注意力机制模块将所述文本和所述情感标签进行特征融合,得到融合表示标识;
第三步,将所述融合表示标识输入所述多层感知器模块并进行计算,得到所述文本和所述情感标签的匹配度;基于所述匹配度优化损失函数使所述模型达到收敛状态,得到优化模型;
第四步,通过所述优化模型对输入的待预测文本进行情感分析。
作为一种改进方案,所述获取文本和情感标签,进一步包括如下步骤:
将文本和情感标签使用分隔符进行连接。
进一步具体地,所述文本包括至少一个文本,所述情感标签包括至少一个情感标签。
作为一种改进方案,所述通过所述自注意力机制模块将所述文本和所述情感标签进行特征融合,得到融合表示标识,进一步包括如下步骤:
通过所述自注意力机制模块将所述文本进行特征融合;
通过所述自注意力机制模块将所述情感标签进行特征融合;
通过所述自注意力机制模块将特征融合后的文本和特征融合后的情感标签进行特征融合,得到所述融合表示标识。
作为一种改进方案,所述基于所述匹配度优化损失函数使所述模型达到收敛状态,进一步包括如下步骤:
基于所述匹配度采用梯度回传算法优化损失函数使所述模型达到收敛状态。
作为一种改进方案,所述通过所述优化模型对输入的待预测文本文本进行情感分析,进一步包括如下步骤:
获取待预测文本和若干情感标签,所述优化模型输出所述待预测文本和每个所述情感标签的匹配度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东英信计算机技术有限公司,未经山东英信计算机技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110236422.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种有色涤纶织物的回收方法
- 下一篇:一种用于玻璃研磨前的药液喷雾装置