[发明专利]一种基于区域CNN-LSTM的情感分析方法在审
| 申请号: | 201810637072.5 | 申请日: | 2018-06-20 |
| 公开(公告)号: | CN108875021A | 公开(公告)日: | 2018-11-23 |
| 发明(设计)人: | 王津;彭博;张学杰;张骥先;杨旭涛 | 申请(专利权)人: | 云南大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06N3/04 |
| 代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 王程远 |
| 地址: | 650091*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 区域模块 文本 情感分析 文本向量 词向量 句子 分解 线性解码器 短语 输入向量 向量矩阵 文本词 池化 构建 基元 卷积 单词 预测 | ||
一种基于区域CNN‑LSTM的情感分析方法,包括如下步骤:建立区域CNN‑LSTM模型;文本中单词的词向量构建,将文本用一个词向量的序列来表示;然后根据文本中的句子或是句子中的短语进行区域模块分解;将上一步分解后的区域模块作为CNN的输入基元,将每一块区域的文本词向量矩阵经过卷积层和最大池化层后得到结果再作为LSTM层的输入向量;将上一步得到的各个区域模块的信息根据该区域模块在文本中的出现顺序输入LSTM层中,以此获取整个文本的文本向量;将上一步所获得的文本向量输入线性解码器,进行情感值Valence和激励值Arousal的预测,以此获得VA情感值结果。
技术领域
本发明涉及文本情感分析领域,特别涉及一种基于区域CNN-LSTM的情感分析方法。
背景技术
情感分析技术目前被广泛地用于在线翻译,用户评价分析和观点挖掘等互联网应用中。尤其是对于目前新兴的各种网络社交平台和购物网站来说,快速的获取用户评论的情感倾向可以为商家在为广告投放和热点话题推送等方面提供很大的便利。从目前的市场需求和技术的发展水平来看,对情感分析技术进行研究和革新具有很大的价值和提升空间。
目前对情感的划分和表示主要有两种方法:一种是类别型的情感表示,使用明确的类别来区分情感,最基本的便有二分类表示法——将情感简单的划分为“积极的”和“消极的”两个对立的类别;更复杂的有Ekman的六元基础情感表示方法,该方法将人类情感划分为“愤怒”、“愉快”、“恐惧”、“悲伤”、“厌恶”和“惊讶”六中基本元素,并使用这些基础情感元素来表示和识别文本中包含的情感。
上述两个类别型的情感表示的方法都是使用离散的分类来表示情感,离散的分类确实可以将文本要表达的情感明确地划分到某一类别中,然而对于一些表达出复杂或是模糊的情感的文本,这一种方法的局限性便显露无疑。例如:“欣喜”和“狂喜”这两个表示不同程度的“愉快”情感的形容词,若使用离散的分类情感标识方法,便只能将两个词归为同一类情感,而忽略了这两个词在情感强烈程度上差别,这样一来就不能准确的捕捉到用户的倾向和偏好。
针对这一缺陷,另一种情感划分方法:使用连续的数值的维度型情感表示方法便成为了一个更为理想的选择。这一类方法的代表有Russell等科学家提出的Valence-Arousal(VA)情感空间——使用连续数值在二维空间中标识情感。其中Valence值代表情绪值,取值范围一般在1-9之间,表示该文本的情感是“积极的”还是“消极的”,数值越接近9表示积极的程度越深,反之则表示越消极;Arousal值代表期望值,表示文本情感的强烈程度,数值越接近9表示情感越强烈,“狂喜”的Arousal值就应大于“欣喜”的Arousal值。这样一来,每一个单词都可以通过一个VA二维空间中的某一个坐标点来唯一的表示其情感值。这样便可解决上文中提到的诸如“欣喜”和“狂喜”这一类情感的类别相同而情感的强烈程度不同的词语在离散的类别型情感表示方法中无法得到准确划分的问题。划分的越准确就意味着服务提供商可以获得更多的有效信息,从而能为用户提供更精确而合理的服务。
基于VA二维情感空间的情感分析主要是针对单词层级(Wei et al.,2011;Malandrakis et al.,2011;Yu et al.,2015)和句子或文本层级(Paltoglouet al.,2013;Malandrakis et al.,2013)进行VA值的自动标定和预测。相关技术将于下一部分中描述。
大部分的语言中,单词都是包含有情感的基础元素,因此对单词进行情感值标定,创建情感词典便成为了文本情感分析研究的基础。目前认可度较高的情感词典都是通过人工标定的方式来创建的,一个词的情感值就需要综合大量的情感值标定人员给出的结果进行一定的数学处理后才能得出一个相对来说公允的数值。显而易见,通过人工的方法来标定情感值需要大量的人力物力和时间。因此,在现有已标定好的情感词库的基础上通过机器学习的方法来自动地标定情感值便具有十分重要的意义及研究价值。
单词层级的文本情感分析技术:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810637072.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于实现标注的方法、装置、设备及存储介质
- 下一篇:一种视频推荐方法及装置





