[发明专利]一种基于多任务学习的方面级别文本情感转换方法有效
| 申请号: | 201910299536.0 | 申请日: | 2019-04-15 |
| 公开(公告)号: | CN110083702B | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 杨敏;曲强;陈磊;姜青山 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
| 代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 耿慧敏 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 任务 学习 方面 级别 文本 情感 转换 方法 | ||
本发明提供一种基于多任务学习的方面级别文本情感转换方法。该方法包括:对于包含多个方面情感表述的文本,构建方面级别的文本转换学习任务并构建方面级别的情感分类学习任务;以所述方面级别的文本转换学习任务作为主任务,以所述方面级别的情感分类学习任务作为辅助任务,通过联合训练所述主任务和所述辅助任务实现方面级别的文本情感转换。本发明的方法能够有效地实现方面级别的文本情感转换并改善了内容保存效果。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种基于多任务学习的方面级别文本情感转换方法。
背景技术
文本情感转换是指将整个文本的情感转换为相反的情感,例如,将积极的情感转换为消极的情感,同时保持情感无关部分不改变。文本情感转换具有十分广泛的应用场景,例如新闻重写、评论态度转变等。
在实际情况中,一段文本往往拥有多个方面表述,对每个方面表述的情感都不尽相同,因此进行方面级别文本情感转换显得尤为重要。然而,现有技术通常仅有例如文档级别的情感转换、还无法做到有效地进行方面级别文本情感转换,此外,现有的文本情感转换方法仅关注情感转换成功率,而在内容保存上效果还很不理想。
因此,需要对现有技术进行改进,以实现方面级别的情感转换,在提高文本转换率的同时改善内容保存的效果。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种基于多任务学习的方面级别文本情感转换方法。
根据本发明的一个方面,提供了一种基于多任务学习的方面级别文本情感转换方法包括以下步骤:
对于包含多个方面情感表述的文本,构建方面级别的文本转换学习任务并构建方面级别的情感分类学习任务;
以所述方面级别的文本转换学习任务作为主任务,以所述方面级别的情感分类学习任务作为辅助任务,通过联合训练所述主任务和所述辅助任务实现方面级别的文本情感转换。
在一个实施例中,对于文本的一个句子,所述联合训练包括:
将该句子和该句子的给定方面表述用词嵌入表示;
将该句子的词嵌入表示和所述给定方面表述的词嵌入表示输入到由长短期记忆网络和注意力层构成的模型进行学习,获得注意力权重分布,其中所述注意力权重分布反映不同词在所述方面级别的文本情感分类学习任务中的重要性;
在所述辅助任务中,将基于所述注意力权重分布得到的文档建模后的句子,利用分类器获得给定方面的情感分类标签;
在所述主任务中,基于所述注意力权重分布实现方面级别的文本情感转换。
在一个实施例中,所述主任务执行以下子步骤:
基于所述注意力权重分布检测给定方面的情感词并且对于所检测出的情感词执行掩码操作,获得转换后的句子;
以所述转换后的句子作为输入,利用序列到序列模型实现方面级别的文本情感转换。
在一个实施例中,对于一个词i,所述掩码操作包括:
计算该词被掩掉的概率pi,表示为:
其中是所述注意力权重分布的平均值,μ是控制sigmoid输出结果的超参数;
通过线性变换计算修改后的句子的词嵌入表示e′(xi):
e′(xi)=(1-pi)e(xi)+pie(S)
其中,e(S)是句子X中基于给定方面表述的情感标签S的词嵌入表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910299536.0/2.html,转载请声明来源钻瓜专利网。





