[发明专利]一种基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法在审
申请号: | 202010184896.9 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111368086A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 黄彪;李涛 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/279;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
地址: | 650093 云南*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 cnn bilstm attention 模型 涉案 新闻 观点 情感 分类 方法 | ||
本发明公开了一种基于CNN‑BiLSTM+attention模型的涉案新闻观点句情感分类方法,所述模型包括:词嵌入层、卷积层、池化层、BiLSTM层、Attention注意力层、Softmax分类层;所述方法包括以下步骤:步骤1:对案件相关新闻的观点句进行预处理,然后将所有词通过词嵌入层编码为词向量;步骤2:将步骤1得到的词向量输入到卷积层,进行卷积操作;步骤3:将卷积后得到的特征向量输入到池化层进行最大池化操作;步骤4:将最大池化后得到的特征向量输入到BiLSTM层;步骤5:将BiLSTM层得到的每个隐藏状态向量进行Attention操作;步骤6:将Attention操作得到的输出通过softmax分类层进行分类,得到目标情感类别概率。本发明可以有效的解决复杂的特征工程和多余手工工作,可以在很大程度上减少工作量和复杂度。
技术领域
本发明涉及自然语言处理和深度学习技术领域,特别涉及一种基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法。
背景技术
涉案新闻观点句的情感分类任务可以看作是句子级的情感分类,而情感分类的方法在以前主要有基于词典和基于机器学习。基于词典的方法一般有个情感词典,将词典中有情感倾向的词通过与句子中的词进行匹配,然后设计规则对整个句子进行情感倾向分析;基于机器学习的方法通常使用分类模型对句子进行情感分类,先从数据集中抽取文本特征,再通过这些特征和标注信息训练一个机器学习分类器,最后将训练好的分类器对句子的情感倾向进行判断。随着深度学习的发展,越来越多的人用神经网络模型去解决问题。
深度学习现在越来越多的应用到自然语言处理NLP任务中,并且取得很好的效果;基于神经网络进行涉案新闻观点句的情感分类时,不用人工做大量的特征提取,也不用加入额外的特征,神经网络可以自动化的提取重要特征;在情感分类方面的研究可以分为,一、基于单模型+特征,比如基于卷积神经网络来对评论进行情感倾向性分析,基于递归神经网络的,基于长短期记忆网络;二、现在的研究很多是基于混合模型+特征,比如将CNN和LSMT结合,即C-LSTM模型,基于双通道长短期记忆网络、卷进神经网络和依存树的BiLSTM+CNN+SPTree。
发明内容
本发明的目的是提供一种基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法,以解决基于规则和统计机器学习方法复杂的特征工程和人工工程的问题。
本发明的上述技术目的是通过以下技术方案得以实现的:
一种基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法,其特征在于:
所述CNN-BiLSTM+attention模型包括:词嵌入层、卷积层、池化层、BiLSTM层、Attention注意力层、Softmax分类层;
所述词嵌入层是用来将句子的词转成低维词向量,所述卷积层是用来自动化抽取词特征,所述池化层是用来降低特征向量维度,所述BiLSTM层是用来记忆长时依赖的序列化信息,所述Attention注意力层是用来权重矩阵强化重要的信息,所述Softmax分类层是用来分类得到概率最大的情感类别;
所述方法包括以下步骤:
步骤1:对案件相关新闻的观点句进行预处理,然后将所有词通过词嵌入层编码为词向量;
步骤2:将步骤1得到的词向量输入到卷积层,进行卷积操作,通过不同大小的卷积核来提取多种粒度的特征;
步骤3:将卷积后得到的特征向量输入到池化层进行最大池化操作,即进行特征向量降维,提取重要的特征;
步骤4:将最大池化后得到的特征向量输入到BiLSTM层,通过两个方向的LSTM单元获取句子中的语义信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010184896.9/2.html,转载请声明来源钻瓜专利网。