[发明专利]基于可学习多单词对打分器的方面级情感三元组抽取方法有效
申请号: | 202110638892.8 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113377908B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 雷印杰;苟延杰 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广东中禾共赢知识产权代理事务所(普通合伙) 44699 | 代理人: | 熊士昌 |
地址: | 610065 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 单词 打分 方面 情感 三元 抽取 方法 | ||
1.基于可学习多单词对打分器的方面级情感三元组抽取方法,其特征在于:包括以下步骤:
S1、将句子评论中的单词转换为词向量序列,并经过一长短期记忆循环网络编码器对词向量序列进行编码,得到编码后的词向量表征;
S2、将编码后的词向量表征使用点乘注意力机制对编码后的词向量进行加权;使用点乘注意力机制对编码后的词向量进行加权,使每个词向量都能对其上下文进行进一步感知,可以形式化如下:
Ae=softmax(HHT),
H′=(1+Ae)H,
其中,H是经过LSTM编码得到的向量,Ae是其本身经过点乘注意力后的注意力权重,H′是该步骤得到的注意力加权后的词向量表征;
S3、使用一可学习的多单词对打分器对每个单词对进行打分,输出一个二维的多通道单词对的特征图;具体实现细节如下:
A=[A1;...;Ah],
其中,A表示得到的h通道的特征图, 该特征图由h个一通道特征图组成,每个特征图都由全连接层将映射到H′映射到不同子空间后进行点乘注意力以建模三元组元素间的全局联系;使用可学习多单词对打分器更高效地建模句中方面词及情感词间的全局关系,生成更有效的特征并抽取情感三元组;
S4、将该二维的多通道单词对的特征图送入一卷积编码-解码框架,输出二维的标注矩阵;
S5、对该标注矩阵进行解码,输出最终的情感三元组集合;
S6、使用损失函数训练模型;
S7、保存训练模型,即可应用于方面级情感三元组抽取。
2.根据权利要求1所述的基于可学习多单词对打分器的方面级情感三元组抽取方法,其特征在于:所述S1、S2中的所有操作也可使用预训练神经网络在一步内完成。
3.根据权利要求1所述的基于可学习多单词对打分器的方面级情感三元组抽取方法,其特征在于:所述S2中加权后的每个词向量都可以对其上下文进行进一步感知。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110638892.8/1.html,转载请声明来源钻瓜专利网。