[发明专利]一种基于区域CNN-LSTM的情感分析方法在审
| 申请号: | 201810637072.5 | 申请日: | 2018-06-20 |
| 公开(公告)号: | CN108875021A | 公开(公告)日: | 2018-11-23 |
| 发明(设计)人: | 王津;彭博;张学杰;张骥先;杨旭涛 | 申请(专利权)人: | 云南大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06N3/04 |
| 代理公司: | 北京君泊知识产权代理有限公司 11496 | 代理人: | 王程远 |
| 地址: | 650091*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 区域模块 文本 情感分析 文本向量 词向量 句子 分解 线性解码器 短语 输入向量 向量矩阵 文本词 池化 构建 基元 卷积 单词 预测 | ||
1.一种基于区域CNN-LSTM的情感分析方法,其特征在于,包括如下步骤:
步骤一、建立区域CNN-LSTM模型,该模型由两个主要部分组成,分别是:区域卷积神经网络层regional CNN和长短记忆神经网络层LSTM,通过将这两部分合理的组合在一起来实现预测文本情感值的功能;
步骤二、文本中单词的词向量构建,将文本用一个词向量的序列来表示;然后根据文本中的句子或是句子中的短语进行区域模块分解;
步骤三、将步骤二分解后的区域模块作为CNN的输入基元,这和传统的CNN将整个文本中单词作为输入基元不同,这样做的好处是为了方便为之后的LSTM层提供输入向量,而且这样也能获取到更多区域模块之间的情感信息,这些信息的还可以根据各自区域模块对整个文本情感的影响程度来衡量权值;
步骤四、将每一块区域的文本词向量矩阵经过卷积层和最大池化层后得到结果再作为LSTM层的输入向量;
步骤五、将上一步得到的各个区域模块的信息根据该区域模块在文本中的出现顺序输入LSTM层中,以此获取整个文本的文本向量;
步骤六、将步骤五中所获得的文本向量输入线性解码器,进行情感值Valence和激励值Arousal的预测,以此获得VA情感值结果。
2.根据权利要求1所述的一种基于区域CNN-LSTM的情感分析方法,其特征在于,所述步骤二中,文本区域模块分解的具体操作为:
首先将文本信息处理为实数矩阵后才作为模型的输入基元,对于一个文本,区域CNN模型将文本中的一个完整的句子作为一个“区域”,从而将文本划分为了R块区域,分别记为r1,...,ri,rj,rk,...,rR,R为句子总数;每块区域由若干个单词组成,模型的输入便是这些区域模块中单词的词向量组成的矩阵;使用Word2Vec工具进行训练来获取单词词向量,再根据模块中的单词查找对应的词向量来组成矩阵。
3.根据权利要求2所述的一种基于区域CNN-LSTM的情感分析方法,其特征在于,所述步骤一中,卷积神经网络层的构建方式具体为:
在每一个区域内,卷积层首先用来提取句子的n-gram特征;区域内的所有单词的向量组成一个矩阵其中|V|是该区域内含有的单词总数,d是向量的维度;区域堆叠为矩阵在每一个区域内,我们使用L个过滤器来提取句子内的n-gram特征信息;假设区域内的一个窗口覆盖ω个词,该窗口组成的矩阵为xn:n+ω-1,则过滤器Fl(1<l<L)根据生成特征映射
公式1中的是两个矩阵间的卷积操作,和b分别是权重矩阵和偏置量,f是修正线性单元(ReLU);当过滤器依次从x1:ω-1至xN+ω-1:N滑过,过滤器Fl计算出相应的特征映射:由于句子长度不可能完全相同,这就导致了yl可能有不同的维度,因此,规定CNN层的最大输入矩阵维度为N,对于单词数少于N的句子,我们使用随机数值填充的向量将其补足。
4.根据权利要求2所述的一种基于区域CNN-LSTM的情感分析方法,其特征在于,所述步骤三中,文本信息指:购物网站上的用户评论或是社交网站上用户发表的微博或是推文类文本信息。
5.根据权利要求1所述的一种基于区域CNN-LSTM的情感分析方法,其特征在于,所述步骤四中,最大池化层建立的具体操作为:
最大池化层对卷积层的输出进行再采样工作即进行取最大值操作,最大池化层通过取最大值操作来“抛弃”非最大值,减少下一层的计算量;同时提取各个区域内部的局部语义信息。
6.根据权利要求1所述的一种基于区域CNN-LSTM的情感分析方法,其特征在于,所述步骤五中,顺序层建立的具体操作为:获取较长文本内句子与句子之间的区域信息;在这一层,各个区域模块的向量被顺序的整合为一个文本向量;在LSTM存储器单元顺序遍历所有区域之后,顺序层的最后一个隐藏状态便是对文本VA情感值预测的代表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810637072.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于实现标注的方法、装置、设备及存储介质
- 下一篇:一种视频推荐方法及装置





