[发明专利]一种基于深度学习和转折关系的文本情感分类方法有效
| 申请号: | 202010243977.1 | 申请日: | 2020-03-31 |
| 公开(公告)号: | CN111611375B | 公开(公告)日: | 2022-06-07 |
| 发明(设计)人: | 牛建伟;高艺伟;赵晓轲;谷飞 | 申请(专利权)人: | 北京航空航天大学;赛尔网络有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/289;G06F40/30;G06N3/04 |
| 代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 祗志洁 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 转折 关系 文本 情感 分类 方法 | ||
本发明提出一种基于深度学习和转折关系的文本情感分类方法,属于自然语言处理、人工智能领域。本发明包括如下步骤:文本和属性编码模块对输入的文本和多个属性进行处理;文本特征提取模块对文本进行语义上下文特征提取;文本和属性交互模块使用神经网络和多注意力机制对文本和属性进行交互计算,获取针对属性的文本向量表示;分类模块将针对属性的文本向量映射到类别向量,得到类别的概率分布;损失函数设计和模型训练模块使用交叉熵损失函数和转折损失函数进行模型训练,得到情感识别模型。本发明通过设置的新型损失函数,来辅助抑制错误偏好的判断,实现针对特定属性的文本准确分类,提高了情感识别的准确率。
技术领域
本发明涉及一种基于深度学习和转折关系的文本情感分类方法,属于自然语言处理、人工智能领域。
背景技术
随着互联网技术的快速发展及广泛普及,网络社交平台,如博客、微博、推特、脸书、论坛等形式网站或应用,作为分享和交流工具已经深入人们的生活,能够让人们交流知识、情感或分享自己对时事的观点及生活状态,尤其智能移动设备的普及使得几乎所有人都可以注册一个账号然后在上面进行分享、评论和转发等。因此,每天都会产生大量的带有主观信息的文本数据。
情感分析是自然语言处理领域的研究热门方向之一,与社会大众联系紧密,甚至会涉及安全问题,从九十年代就开始有相关研究。主观信息往往带有情感倾向,或者高兴,或者悲伤,或者愤怒,甚至会极端愤怒。这种主观信息或客观事件能够通过网络社交平台快速蔓延,引发大范围网民的情感共鸣,可能造成事件的不可控。因此,企事业单位往往设立舆情监测部门对网络主观信息进行采集并统计分析,以发现影响范围广的事件。此外,企业也可以通过电商网站上对某产品的评论,判断产品的欢迎程度及改进方向,辅助进行营销。还有研究表明利用情感判别分析互联网上股民的情绪对预测股票趋势有辅助作用。
文本的情感分析问题往往被转化为一个分类问题进行处理。目前,情感分析按照模型机制可分为基于浅层学习的方法和基于深度学习的方法两种类型。基于浅层学习的情感分析方法是通过在情感词典上利用浅层学习方法构造分类器的方式来实现情感分类,其中,有研究表明情感词典可面向领域构造来提升识别精度,但该方法是往往针对特定范围或任务的,不利于扩展。基于深度学习的情感分析方法是通过数据集训练深度网络而实现“端到端”的情感分类,其中,数据集的构造和网络的结构均能影响情感分类性能。针对特定属性的情感分析,是指预先指定一个属性,判断文本在该属性上所表达的情感,如文本“thefood is delicious,but the service is bad.”,对于属性“food”,文本情感倾向是正向的;而对于属性“service”,文本情感倾向是负向的。针对特定属性的深度学习情感模型研究主要是基于长短期记忆LSTM(Long Short-Term Memory)和注意力机制的融合方法。目前有学者将单文本的多个属性的类别判断为相同倾向,使得多个不完全相同类别属性的预测准确率很低;同时,尚未见到同一个文本中多个属性之间的关系被纳入研究。
发明内容
针对现有技术中容易将同一个文本不同属性类别判断为相同类别的偏好,存在对同一个文本中多个不完全相同类别属性的预测准确率很低的问题,本发明提出了一种基于深度学习和转折关系的文本情感分类方法。
本发明提供的基于深度学习和转折关系的文本情感分类方法,对应的文本情感分类模型包括文本和属性编码模块、文本特征提取模块、文本和属性交互模块、分类模块、损失函数设计和模型训练模块。所述方法实现步骤包括如下五个步骤:
步骤1:文本和属性编码模块对输入的文本和给定的属性进行分词和去除停用词处理,将得到文本和属性的单词根据预先准备的词向量文件映射为低维实数向量;
步骤2:文本特征提取模块使用LSTM循环神经网络捕捉文本单词间的上下文语义关系;
步骤3:文本和属性交互模块使用神经网络和多attention机制对文本和属性进行交互计算,获取针对属性的文本向量表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;赛尔网络有限公司,未经北京航空航天大学;赛尔网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010243977.1/2.html,转载请声明来源钻瓜专利网。





