[发明专利]一种基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法在审
| 申请号: | 202010184896.9 | 申请日: | 2020-03-17 |
| 公开(公告)号: | CN111368086A | 公开(公告)日: | 2020-07-03 |
| 发明(设计)人: | 黄彪;李涛 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/211;G06F40/279;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京科亿知识产权代理事务所(普通合伙) 11350 | 代理人: | 汤东凤 |
| 地址: | 650093 云南*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 cnn bilstm attention 模型 涉案 新闻 观点 情感 分类 方法 | ||
1.一种基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法,其特征在于:
所述CNN-BiLSTM+attention模型包括:词嵌入层、卷积层、池化层、BiLSTM层、Attention注意力层、Softmax分类层;
所述词嵌入层是用来将句子的词转成低维词向量,所述卷积层是用来自动化抽取词特征,所述池化层是用来降低特征向量维度,所述BiLSTM层是用来记忆长时依赖的序列化信息,所述Attention注意力层是用来权重矩阵强化重要的信息,所述Softmax分类层是用来分类得到概率最大的情感类别;
所述方法包括以下步骤:
步骤1:对案件相关新闻的观点句进行预处理,然后将所有词通过词嵌入层编码为词向量;
步骤2:将步骤1得到的词向量输入到卷积层,进行卷积操作,通过不同大小的卷积核来提取多种粒度的特征;
步骤3:将卷积后得到的特征向量输入到池化层进行最大池化操作,即进行特征向量降维,提取重要的特征;
步骤4:将最大池化后得到的特征向量输入到BiLSTM层,通过两个方向的LSTM单元获取句子中的语义信息;
步骤5:将BiLSTM层得到的每个隐藏状态向量进行Attention操作,“去伪存真”,专注于找到输入数据中显著的与当前输出相关的有用信息;
步骤6:将Attention操作得到的输出通过softmax分类层进行分类,得到目标情感类别概率,即观点句是积极情感或消极情感的概率。
2.根据权利要求1所述的基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法,其特征在于:步骤1中所述预处理是指:将构建好的涉案新闻观点句数据集后通过jieba进行分词,通过numpy、pandas等工具去除无用符号、更改数据格式;通过谷歌提供的bert预训练模型得到每个词的词向量,建立词向量映射表。
3.根据权利要求1所述的基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法,其特征在于:步骤2中,卷积层对词向量进行卷积,抽取高维特征,通过多个卷积核来抽取特征;所述卷积核为:f=[f1+f2…fn],则在卷积之后的特征为s=[s1+s2+…sl];其中,
si=g(∑fTk+1xTk+1+b)
g表示非线性激活函数,b是表示偏置项,使用不同的卷积核可以抽取到不同的特征。
4.根据权利要求1所述的基于CNN-BiLSTM+attention模型的涉案新闻观点句情感分类方法,其特征在于:步骤3中所述最大池化操作就是将通过卷积得到的高维特征向量进行降维,提取重要特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010184896.9/1.html,转载请声明来源钻瓜专利网。





