[发明专利]基于可学习多单词对打分器的方面级情感三元组抽取方法有效
申请号: | 202110638892.8 | 申请日: | 2021-06-08 |
公开(公告)号: | CN113377908B | 公开(公告)日: | 2022-06-28 |
发明(设计)人: | 雷印杰;苟延杰 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广东中禾共赢知识产权代理事务所(普通合伙) 44699 | 代理人: | 熊士昌 |
地址: | 610065 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 学习 单词 打分 方面 情感 三元 抽取 方法 | ||
本发明提供基于可学习多单词对打分器的方面级情感三元组抽取方法,属于自然语言处理领域,通过将将句子评论中的单词转换编码,得到词向量表征;将编码后的词向量表征使用点乘注意力机制对编码后的词向量进行加权;再输出一个二维的多通道单词对的特征图;将该二维的多通道单词对的特征图送入一卷积编码‑解码框架,输出二维的标注矩阵;对该标注矩阵进行解码,输出最终的情感三元组集合;使用损失函数训练模型;保存训练模型,即可应用于方面级情感三元组抽取。本发明是基于端到端的解决方案,使用可学习多单词对打分器更高效地建模句中方面词及情感词间的全局关系,以生成更有效的特征并抽取情感三元组。
技术领域
本发明涉及自然语言处理领域,特别涉及基于可学习多单词对打分器的方面级情感三元组抽取方法。
背景技术
方面级情感三元组抽取任务通常用于细粒度地抽取评论句子中包含的三元组方面词,观点,情感,在这里,方面词指评价的对象,观点是评论对象时用到的描述词,情感是指对象在上下文中的整体情感,一般包括正向,中性,负向。其目的是从句子中获得全面的信息用于细粒度情感分析,可以广泛应用于电商评论挖掘、社会计算等领域。
由于深度学习强大的建模能力,基于深度学习方法的模型一般被用来对该任务进行建模。具体讲,基于深度学习的方面级情感三元组抽取通常有两种解决方案:(1)流水线式:这种方法一般先在第一个阶段对句子中的方面词和观点词分别抽取;在第二阶段,再对抽取得到的多个方面词及情感词进行组合判断对应的情感分类并组成三元组。然而,流水线式的方法存在错误传播的问题,会导致模型性能无法达到最优。(2)端到端式:这种方法通过设计更符合该任务的标注方案,从而使得可以端到端优化模型,从理论上解决了流水线式错误传播的问题。然而,现有端到端的解决方法无法像流水线式方法那样显示地全局组合方面词和观点词。
发明内容
本发明的主要目的在于提供一种基于可学习多单词对打分器的方面级情感三元组抽取方法,可以有效弥补背景技术中提出的不足。
为实现上述目的,本发明采取的技术方案为:
基于可学习多单词对打分器的方面级情感三元组抽取方法,包括以下步骤:
S1、将句子评论中的单词转换为词向量序列,并经过一长短期记忆循环网络编码器对词向量序列进行编码,得到编码后的词向量表征;
S2、将编码后的词向量表征使用点乘注意力机制对编码后的词向量进行加权;
S3、使用一可学习的多单词对打分器对每个单词对进行打分,输出一个二维的多通道单词对的特征图;
S4、将该二维的多通道单词对的特征图送入一卷积编码-解码框架,输出二维的标注矩阵;
S5、对该标注矩阵进行解码,输出最终的情感三元组集合;
S6、使用损失函数训练模型;
S7、保存训练模型,即可应用于方面级情感三元组抽取。
优选的,所述S1、S2中的所有操作还可使用预训练神经网络在一步内完成。
优选的,所述S2中加权后的每个词向量都可以对其上下文进行进一步感知。
与现有技术相比,本发明具有如下有益效果:
1.能够在兼顾模型对三元组元素的全局组合性和局部一致性的同时,避免错误传播问题。
2.效果高,在基于长短期记忆循环网络编码器的模型中,在四个数据集RES14、LAP14、RES15和RES16上,模型可以达到68.86、52.13、56.81和67.52的F1值。在基于预训练网络(BERT)的模型中,在四个数据集RES14、LAP14、RES15和RES16上,模型可以达到71.20、58.36、60.47和69.13的F1值。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110638892.8/2.html,转载请声明来源钻瓜专利网。