[发明专利]基于情绪嵌入的情绪原因对抽取方法有效
| 申请号: | 202210464202.6 | 申请日: | 2022-04-29 |
| 公开(公告)号: | CN114817566B | 公开(公告)日: | 2023-03-10 |
| 发明(设计)人: | 饶国政;李志威 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/284;G06N3/0442;G06N3/08 |
| 代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 情绪 嵌入 原因 抽取 方法 | ||
1.基于情绪嵌入的情绪原因对抽取方法,其特征在于,基于情绪嵌入的情绪原因对抽取的模型实现情绪原因对抽取,该模型的实现步骤如下:
S1.词嵌入编码
模型的输入通过词嵌入得到文本的时序表示s={s1,s2,...,sn};
S2.情绪编码
通过第一层词级Bi-LSTM网络得到情绪词级特征表示r′e={r′1e,r′2e,...,r′ne}:
其中,是词级Bi-LSTM网络,用于提取情绪词特征然后将r′e输入到子句级Bi-LSTM网络中,最终得到情绪子句级特征表示
其中,是子句级Bi-LSTM网络,用于提取情绪子句特征
S3.原因编码
原因编码包括词级Bi-LSTM网络、情绪融合模块、情感嵌入模块和子句级Bi-LSTM网络;
通过词级Bi-LSTM网络,得到原因词级特征表示r′c={r′1c,r′2c,...,r′nc};
使用一个大小受限的窗口在情感子句表示re上进行滑动,然后将窗口中的所有特征表示进行融合,最后将融合后的特征嵌入到中心子的原因词级特征中;当融合窗口的大小为t时,表示以当前子句为中心,即0位置,需要对{-t,…,0,…,t}范围内的情绪子句进行情绪特征融合操作;当t=0时,表示不对情感子句做融合操作,实现情感和原因的子句级特征是独立提取的;
在情感嵌入模块中,将原因词级特征表示r′c、情感词级特征表示r′e和情感子句级特征表示融合re′进行拼接,生成带有情感特征嵌入的原因词级特征表示rce;
rce=[r′c,r′e,re′]
其中[,]表示拼接函数,然后将它们输入到一个子句级Bi-LSTM网络中,得到原因子句级特征表示;
其中,表示子句级别的Bi-LSTM网络,用于提取原因子句级特征表示
S4.情绪原因对编码
首先,将情感子句和原因子句两两组会配对,得到情感原因对,记为其中包括情感从句特征re和原因从句特征rc;
以作为图的一个节点,所有具有相同情绪特征的节点一起构建一个简单图,称为子句对图;一个N个子句的文档总共需要构建N个子句对图;将与中心节点距离小于等于2的子句对用于构建子句对图,即
每个图具有三种不同的边,分别是D0边,用于表示节点自迁移的自循环边;D1边,用于连接距离为1的邻接节点,对于中心节点则其邻接节点和需要用D1连接起来;D2边,用于连接距离为2的邻接节点,具体用法如D1;
通过对情绪子句编码网络和情绪嵌入网络的输出进行特征转换,得到转换得到节点的特征表示具体是,子句对图中的特征是由与其连接的节点根据不同的边使用不同转换参数变换后集成得到;
其中是权重矩阵,分别表示与节点连接的D1边、D2边和D0边的权重;z是归一化因子,它的值等于节点的度;σ表示非线性激活函数,使用的是ReLU作为激活函数。
在对情绪原因对进行分类前加入距离信息,对于候选子句对节点的最终表示pfinal是与di,j的拼接,
其中是距离嵌入;
S5.情绪原因对预测
使用全连接神经网络作为分类器,对最终的情绪原因对pfinal进行分类;
其中,Wp是权重矩阵,bp是偏置向量;
通过最小化预测概率和真实标签之间的差值来得到最终的优化后的模型,文档中所有子句的交叉熵损失函数如下:
其中yij和分别是子句对pij的真实预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210464202.6/1.html,转载请声明来源钻瓜专利网。





