[发明专利]基于BERT和方面特征定位模型的方面级情感分析方法及系统有效
| 申请号: | 202110670846.6 | 申请日: | 2021-06-17 |
| 公开(公告)号: | CN113705238B | 公开(公告)日: | 2022-11-08 |
| 发明(设计)人: | 庞光垚;陆科达;玉振明;彭子真;朱肖颖;黄宏本;莫智懿;农健;冀肖榆 | 申请(专利权)人: | 梧州学院 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 卢泽明 |
| 地址: | 543000 广西*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 bert 方面 特征 定位 模型 情感 分析 方法 系统 | ||
1.一种基于BERT和方面特征定位模型的方面级情感分析方法,其特征在于,包括:
S1.利用BERT模型来获得高质量的上下文信息表示和方面信息表示,以保持文本信息的完整性;
S2.构建一个基于多头注意机制的注意编码器来学习体词表征和上下文表征之间的相互作用,整合体词和上下文之间的关系,进一步区分不同句子和方面词对分类结果的贡献;所述“构建一个基于多头注意机制的注意编码器来学习体词表征和上下文表征之间的相互作用,整合体词和上下文之间的关系”,是指基于多头部注意机制实现在方面级情感分析的重要特征提取,提取上下文和目标的重要信息,具体为:首先引入转换编码器,所述转换编码器是一种基于多头注意机制和位置前馈网络的新型特征抽取器,能够在不同的特征表示子空间中学习到不同的重要信息和直接捕获序列中的长期相关性;然后通过转换编码器从BERT模型生成的方面信息表示和上下文信息表示中提取交互语义,确定对方面词的情感定性最为重要的上下文,同时以上下文的长期依赖信息和上下文感知信息作为位置前馈网络的输入数据,分别生成隐藏状态,并在均值池化操作后得到上下文交互的最终交互隐藏状态、语境与方面词的最终互动隐藏状态;其中,
所述“通过转换编码器从BERT模型生成的方面信息表示和上下文信息表示中提取交互语义,确定对方面词的情感定性最为重要的上下文,同时以上下文的长期依赖信息和上下文感知信息作为位置前馈网络的输入数据,分别生成隐藏状态,并在均值池化操作后得到上下文交互的最终交互隐藏状态、语境与方面词的最终互动隐藏状态”具体包括:
S201.通过组成转换编码器中多头注意机制的多个自注意机制从BERT模型生成的方面信息表示和上下文信息表示中映射出一个查询序列和一系列在并行子空间中捕捉不同的重要信息的键K值V;
S202.通过注意力得分函数公式fs(Q,K,V)=σ(fe(Q,K))V计算得到每个捕捉到的重要信息的注意力得分,其中σ(fe(Q,K))表示归一化指数函数,fe(Q,K)是学习K和Q之间相关特征的能量函数,并通过以下公式计算;
其中表示比例因子,dk是查询Q和键向量K的维数;
S203.将上下文表示和方面表示输入到注意力得分函数公式fmh(Q,K,V)=[a1;a2;...;ai;...;an-head]Wd中,分别获得上下文的长期依赖信息ccc和上下文感知信息tca,以捕获上下文的长期依赖性,和确定哪些上下文对方面词的情感定性最为重要;其中,ai表示第i个捕捉到的重要信息的注意力分数,[a1;a2;…;ai;…;an-head]表示串联向量,Wd是注意力权重矩阵,ccc=fmh(Ec,Ec),tca=fmh(Ec,Ea);
S204.转换编码器分别以ccc和tca作为位置前馈网络的输入数据,生成隐藏状态hc和ha,所述位置前馈网络是多层感知器的一种变体,记为PFN(h),所述PFN(h)、hc和ha定义如下:
hc=PFN(ccc)
ha=PFN(tca);
PFN(h)=ζ(hW1+b1)W2+b2;
其中,ξ(hW1+b1)是校正后的线性单元,b1和b2是偏置值,W1和W2表示可学习的权重参数;
S205.在对隐藏状态hc和ha进行均值池化操作之后,得到上下文交互的最终交互隐藏状态hcm、语境与方面词的最终互动隐藏状态ham;
S3.构造一个方面特征定位模型来捕获句子建模时的方面信息,并将方面的完整信息整合到交互语义中,以减少与方面词无关的干扰词的影响,提高方面词信息的完整性;
S4.融合与目标相关的上下文和目标重要信息,并在融合信息的基础上利用情绪预测因子预测不同情绪极性的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于梧州学院,未经梧州学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110670846.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:资源请求方法、设备及存储介质
- 下一篇:一种合成孔径雷达辐射定标方法及装置





