[发明专利]基于情绪嵌入的情绪原因对抽取方法有效
| 申请号: | 202210464202.6 | 申请日: | 2022-04-29 |
| 公开(公告)号: | CN114817566B | 公开(公告)日: | 2023-03-10 |
| 发明(设计)人: | 饶国政;李志威 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/211;G06F40/284;G06N3/0442;G06N3/08 |
| 代理公司: | 天津市三利专利商标代理有限公司 12107 | 代理人: | 韩新城 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 情绪 嵌入 原因 抽取 方法 | ||
本发明公开一种基于情绪嵌入的情绪原因对抽取方法,利用基于情绪嵌入对情绪原因对抽取的模型实现情绪原因对抽取,该模型的抽取通过词嵌入、情绪编码、原因编码、情绪原因对编码和情绪原因对预测实现,通过词嵌入获得输入文本的词嵌入表征;通过情绪编码,获得情绪子句级特征表示;通过原因编码,获得原因子句级特征表示;然后利用情绪原因对编码,获得情绪原因对特征编码;最后利用softmax图层输出标签上的概率分布,实现情绪原因对抽取。本发明的方法可以利用情绪和原因之间的因果关系和相互指示的特性,提高情绪原因对抽取的能力。
技术领域
本发明涉及情绪原因分析技术领域,特别是涉及一种基于情绪嵌入的情绪原因对抽取方法。
背景技术
互联网变得越来越普及,人们的生活和互联网的联系越来越紧密,越来越多的人开始通过互联网获取各类资讯以及发表自己的看法与意见。文本数据是互联网上每天源源不断的产生新的数据中,质量最高,数量也最多的一种。另一方面,文本数据也是最符合人们语言习惯的一种数据类型,因成为是人们获取信息和表达情绪最重的一种载体之一。如何对这些海量的文本数据进行分析来获取有用信息有非常重要的研究价值,文本数据的情绪分析是具体分析的一个方向。但是目前的文本情绪分析仅仅关注情绪类别,属于比较浅层的情绪分析任务。而我们有时候更关心到底是什么原因导致了这些情感,由此衍生了更深层次的情绪分析任务:情绪原因对抽取。。
情绪原因对抽取任务在许多领域中都有重要的意义,可以广泛应用于医学、社会学、商业分析等领域。现有研究主要处理方式是先分别获取情绪特征表示和原因特征表示,然后将它们进行拼接组合,生成情绪原因对特征表示,最后再对此特征表示进行特征转换。这些研究完全忽略了情绪和原因之间存在因果关系这一事实,未能利用它们相互指示的特性。
发明内容
本发明的目的是针对现有技术中存在的技术缺陷,而提供一种基于情绪嵌入的情绪原因对抽取模型,并提供基于情绪嵌入的情绪原因对抽取模型进行情绪原因对抽取的方法。
为实现本发明的目的所采用的技术方案是:
一种情绪嵌入的情绪原因对抽取方法,包括:
基于情绪嵌入的情绪原因对抽取模型实现情绪原因对抽取,该模型的实现步骤如下:
S1.词嵌入编码
模型的输入通过词嵌入得到文本的时序表示s={s1,s2,…,sn};
S2.情绪编码
通过第一层词级Bi-LSTM网络得到情绪词级特征表示
其中,是词级Bi-LSTM网络,用于提取情绪词特征然后将r′e输入到子句级Bi-LSTM网络中,最终得到情绪子句级特征表示
其中,是子句级Bi-LSTM网络,用于提取情绪子句特征
S3.原因编码
原因编码包括词级Bi-LSTM网络、情绪融合模块、情感嵌入模块和子句级Bi-LSTM网络;
通过词级Bi-LSTM网络,得到原因词级特征表示
使用一个大小受限的窗口在情感子句表示re上进行滑动,然后将窗口中的所有特征表示进行融合,最后将融合后的特征嵌入到中心子的原因词级特征中;当融合窗口的大小为t时,表示以当前子句为中心,即0位置,需要对{-t,…,0,…,t}范围内的情绪子句进行情绪特征融合操作;当t=0时,表示不对情感子句做融合操作,换句话说,是情感和原因的子句级特征是独立提取的;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210464202.6/2.html,转载请声明来源钻瓜专利网。





