[发明专利]情感原因对抽取模型的训练方法、装置、设备及介质有效
申请号: | 202210039899.2 | 申请日: | 2022-01-14 |
公开(公告)号: | CN114065769B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 琚生根;高德辰;周刚 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 王新哲 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感 原因 抽取 模型 训练 方法 装置 设备 介质 | ||
本发明实施例公开了情感原因对抽取模型的训练方法、装置、设备及介质,涉及神经网络模型领域,方法包括:将文档样本输入至第一编码网络以对词和子句编码,得到情感子句表示和原因子句表示;对每个子句的两种子句表示进行预测,得到两种子句预测结果、情感输出及原因输出;将情感输出和原因输出输入至图注意力网络以更新;基于配对网络,根据更新后的两种输出得到对应的情感表示和原因表示,将情感表示和原因表示配对以得到情感原因对;根据预测网络,得到情感原因对预测结果;根据预测结果计算损失值并更新模型。由此,本发明利用图注意力网络对每个子句间的相互关系进行提取,丰富了每个子句的情感输出和原因输出包含的信息,提高了准确率。
技术领域
本发明涉及神经网络模型领域,尤其涉及一种情感原因对抽取模型的训练方法、装置、设备及介质。
背景技术
情感分类任务则主要是对文本进行情感分类,但是随着自然语言处理技术的不断发展,仅仅是对情感进行分类的任务已经不能够满足现实生活中的需求,所以研究者们将目光转向到研究情感背后的原因。
因此,如何确定文本中的情感词/句和指向情感词/句的原因词/句,为当下的主要研究方向之一。
发明内容
有鉴于此,本发明提供一种情感原因对抽取模型的训练方法、装置、设备及介质,用以确定文本中的情感子句和指向情感子句的原因子句。
第一方面,本发明实施例提供一种情感原因对抽取模型的训练方法,包括:
将文档样本输入至所述第一编码网络,得到文档样本中每个子句的情感子句表示和每个子句的原因子句表示;
基于第二编码网络,根据每个所述子句的情感子句表示和原因子句表示,得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果,并得到每个所述子句的情感输出和每个所述子句的原因输出,其中,所述每个所述子句的情感输出通过子句的第一原因子句预测结果和情感子句表示得到,所述每个所述子句的原因输出通过子句的第一情感子句预测结果和原因子句表示得到;
将每个所述子句的情感输出和原因输出输入至图注意力网络,得到每个所述子句更新后的情感输出和更新后的原因输出,其中,所述图注意力网络用于根据每个所述子句的情感输出和原因输出,更新每个所述子句的情感输出和原因输出;
基于所述配对网络,根据每个所述子句更新后的情感输出得到每个所述子句的情感表示,及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示,并将所有所述子句的情感表示和原因表示两两配对,得到情感原因对;
将所有所述情感原因对输入至预测网络,得到情感原因对预测结果;
根据第一预设算式,得到所述情感原因对预测结果对应的情感原因对预测损失值,并利用所述情感原因对预测损失值更新所述情感原因对抽取模型。
可选的,在本发明实施例提供的一种实施方式中,所述图注意力网络包含依次相连的预设数量层图注意力层,第一层图注意力层用于更新每个所述子句的情感输出和原因输出,图注意力网络的其余每层所述图注意力层均用于更新上一个图注意力层的情感输出和原因输出。
可选的,在本发明实施例提供的一种实施方式中,所述基于所述配对网络,根据每个所述子句更新后的情感输出得到每个所述子句的情感表示,及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示,包括:
将每个所述子句更新后的情感输出输入至所述配对网络的第二预设算式,得到情感表示,及将每个所述子句更新后的原因输出输入至所述配对网络的第三预设算式,得到原因表示;
所述第二预设算式包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210039899.2/2.html,转载请声明来源钻瓜专利网。