[发明专利]一种基于RoBERTa模型的情感分析方法及装置在审
申请号: | 202210301411.9 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114742066A | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 侯培国;夏宇同 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/151;G06N3/04;G06N3/08 |
代理公司: | 石家庄众志华清知识产权事务所(特殊普通合伙) 13123 | 代理人: | 张建 |
地址: | 066004 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 roberta 模型 情感 分析 方法 装置 | ||
1.一种基于RoBERTa模型的情感分析方法,其特征在于,包括:
获取情感分析数据集并进行数据预处理,得到训练集、验证集和测试集;
提取训练集和验证集的评论文本转换成无标签数据集;
构建RoBERTa-WWM-ext模型,对无标签数据集中的评论文本进行随机掩码处理,得到掩码标志位,再通过对掩码标志位进行词预测的方式训练RoBERTa-WWM-ext模型,得到训练好的RoBERTa-WWM-ext模型;
构建双向独立循环神经网络并训练,将完成掩码预测训练任务的RoBERTa-WWM-ext模型的最后一层隐藏层外接双向独立循环神经网络,得到最终的情感分析模型,其中,双向独立循环神经网络需要对双向独立循环神经网络输出的特征向量进行权重分配;
通过最终的情感分析模型进行情感极性预测,将测试集中评论文本输入情感分析模型,输出情感类别标签。
2.根据权利要求1所述的一种基于RoBERTa模型的情感分析方法,其特征在于,所述提取训练集和验证集的评论文本转换成无标签文本包括:
将无标签数据集的格式转换成设定的表格形式。
3.根据权利要求1所述的一种基于RoBERTa模型的情感分析方法,其特征在于,所述构建RoBERTa-WWM-ext模型,将无标签数据集中的评论文本进行随机掩码处理,得到掩码标志位,再通过对掩码标志位进行词预测的方式训练RoBERTa-WWM-ext模型,得到训练好的RoBERTa-WWM-ext模型包括:
通过掩码预测的预训练过程,更新RoBERTa-WWM-ext模型的参数,为RoBERTa-WWM-ext模型做情感分析任务时获得更合理的初始化。
4.根据权利要求1所述的一种基于RoBERTa模型的情感分析方法,其特征在于,所述构建双向独立循环神经网络并训练,将完成掩码预测训练任务的RoBERTa-WWM-ext模型的最后一层隐藏层外接双向独立循环神经网络,得到最终的情感分析模型,其中,双向独立循环神经网络需要对双向独立循环神经网络输出的特征向量进行权重分配包括:
将样本序列编码为包含词向量、位置向量、段向量的输入序列,将其输入RoBERTa-WWM-ext模型由多头自注意力机制组成的核心处理层进行特征提取;构建双向独立循环神经网络,用于处理RoBERTa-WWM-ext模型最后一层Transformer层输出的全部隐藏向量,结合正向序列和反向序列的特征向量,学习句子中的长距离依赖信息。
5.根据权利要求1所述的一种基于RoBERTa模型的情感分析方法,其特征在于,所述双向独立循环神经网络的结构式为:
ht=σ(Wxt+U⊙ht-1+b)
式中,σ为ReLU激活函数,W为权重矩阵,xt代表t时刻的输入,U代表循环层的权重,ht-1表示t-1时刻的序列输出,b为偏置,运算符⊙代表矩阵U和ht-1对应位置相乘。
6.根据权利要求1所述的一种基于RoBERTa模型的情感分析方法,其特征在于,所述权重分配公式为:
其中,ui为隐藏状态信息的非线性化,uw是随机初始化注意力矩阵,αi用来计算隐藏层中第i项对于文本序列在情感分析任务的信息相关度。
7.根据权利要求1所述的一种基于RoBERTa模型的情感分析方法,其特征在于,所述情感分析模型通过交叉熵函数进行训练,用于优化情感分析模型。
8.一种基于RoBERTa模型的情感分析装置,其特征在于,包括:
获取模块,用于获取情感分析数据集并进行预处理,得到训练集、验证集和测试集,并提取训练集和验证集的评论文本转换成无标签数据集;
第一构建模块,用于构建RoBERTa-WWM-ext模型,将无标签数据集中的评论文本进行随机掩码处理,得到掩码标志位,再通过对掩码标志位进行词预测的方式训练RoBERTa-WWM-ext模型,得到训练好的RoBERTa-WWM-ext模型;
第二构建模块,用于构建双向独立循环神经网络并训练,将完成掩码预测训练任务的的RoBERTa-WWM-ext模型的最后一层隐藏层外接双向独立循环神经网络,得到最终的情感分析模型,其中,双向独立循环神经网络需要对双向独立循环神经网络输出的特征向量进行权重分配;
输出模块,得到最终的情感分析模型,将测试集中评论文本输入情感分析模型进行情感极性预测,输出情感类别标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210301411.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气罐定量快灌机构及方法
- 下一篇:一种火灾回燃试验箱及使用方法