[发明专利]情感原因对抽取模型的训练方法、装置、设备及介质有效
| 申请号: | 202210039899.2 | 申请日: | 2022-01-14 |
| 公开(公告)号: | CN114065769B | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 琚生根;高德辰;周刚 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06F40/30 | 分类号: | G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 王新哲 |
| 地址: | 610065 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 情感 原因 抽取 模型 训练 方法 装置 设备 介质 | ||
1.一种情感原因对抽取模型的训练方法,其特征在于,所述情感原因对抽取模型包括第一编码网络、第二编码网络、图注意力网络、配对网络及预测网络,所述方法包括:
将文档样本输入至所述第一编码网络,得到文档样本中每个子句的情感子句表示和每个子句的原因子句表示;
基于第二编码网络,根据每个所述子句的情感子句表示和原因子句表示,得到每个所述子句的第一情感子句预测结果和第一原因子句预测结果,并得到每个所述子句的情感输出和每个所述子句的原因输出,其中,所述每个所述子句的情感输出通过子句的第一原因子句预测结果和情感子句表示得到,所述每个所述子句的原因输出通过子句的第一情感子句预测结果和原因子句表示得到;
将每个所述子句的情感输出和原因输出输入至图注意力网络,得到每个所述子句更新后的情感输出和更新后的原因输出,其中,所述图注意力网络用于根据每个所述子句的情感输出和原因输出,更新每个所述子句的情感输出和原因输出;
基于所述配对网络,根据每个所述子句更新后的情感输出得到每个所述子句的情感表示,及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示,并将所有所述子句的情感表示和原因表示两两配对,得到情感原因对;
将所有所述情感原因对输入至预测网络,得到情感原因对预测结果;
根据第一预设算式,得到所述情感原因对预测结果对应的情感原因对预测损失值,并利用所述情感原因对预测损失值更新所述情感原因对抽取模型,其中,所述第一预设算式包括:
式中,
2.根据权利要求1所述的方法,其特征在于,所述图注意力网络包含依次相连的预设数量层图注意力层,第一层图注意力层用于更新每个所述子句的情感输出和原因输出,图注意力网络的其余每层所述图注意力层均用于更新上一个图注意力层的情感输出和原因输出。
3.根据权利要求1所述的方法,其特征在于,所述基于所述配对网络,根据每个所述子句更新后的情感输出得到每个所述子句的情感表示,及根据每个所述子句更新后的原因输出得到每个所述子句的原因表示,包括:
将每个所述子句更新后的情感输出输入至所述配对网络的第二预设算式,得到情感表示,及将每个所述子句更新后的原因输出输入至所述配对网络的第三预设算式,得到原因表示;
所述第二预设算式包括:
式中,表示第
所述第三预设算式包括:
式中,表示第
4.根据权利要求3所述的方法,其特征在于,所述将所有所述子句的情感表示和原因表示两两配对,得到情感原因对,包括:
基于双仿射机制,将每个所述子句的情感表示作为中心项,将每个所述子句的原因表示作为从属项,并基于配对网络中的预设算式集,将所有所述中心项和所有所述从属项两两配对,得到对应的情感原因对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210039899.2/1.html,转载请声明来源钻瓜专利网。





