[发明专利]一种基于卷积神经网络的企业舆情情感分类方法及系统在审
| 申请号: | 201910207891.0 | 申请日: | 2019-03-19 |
| 公开(公告)号: | CN110083700A | 公开(公告)日: | 2019-08-02 |
| 发明(设计)人: | 李鹏飞;徐俊刚 | 申请(专利权)人: | 北京中兴通网络科技股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
| 代理公司: | 北京君尚知识产权代理事务所(普通合伙) 11200 | 代理人: | 司立彬 |
| 地址: | 100094 北京市海淀区西*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 池化 卷积神经网络 词向量 连接层 矩阵 情感分类模型 分类 情感分类 文本 嵌入层 卷积 并列 预处理 输入文本 特征提取 向量特征 第三层 第一层 特征图 文本词 积层 | ||
1.一种基于卷积神经网络的企业舆情情感分类方法,其步骤包括:
1)利用卷积神经网络训练生成一企业舆情情感分类模型;其中该企业舆情情感分类模型的第一层为词嵌入层,第二层为多个并列的卷积层,第三层为多个并列的池化层,第四层为全连接层;
2)该企业舆情情感分类模型的词嵌入层对待分类的企业舆情文本进行预处理生成对应的词向量矩阵;
3)该企业舆情情感分类模型的各卷积层分别对输入的词向量矩阵进行特征提取,每一卷积层对应得到一文本词向量特征图并输入到一对应的池化层;
4)该企业舆情情感分类模型的各池化层分别提取所输入文本词向量特征图的平均特征和最强特征,并将其输入到该企业舆情情感分类模型的全连接层;
5)该企业舆情情感分类模型的全连接层根据各池化层输入的特征对待分类的企业舆情文本进行分类,得到待分类的企业舆情文本的舆情类别。
2.如权利要求1所述的方法,其特征在于,该卷积神经网络的第一层为词嵌入层,第二层为多个并列的卷积层,第三层为多个并列的池化层,第四层为全连接层;对该卷积神经网络进行训练的方法为:
11)卷积神经网络中的词嵌入层将训练集中的每一企业舆情样本数据转化为一低维特征词向量表示;
12)各卷积层分别对步骤11)得到的词向量特征表示进行特征提取,分别得到一文本词向量特征图;再利用激活函数对每一文本词向量特征图进行非线性处理;
13)将步骤12)得到的每一文本词向量特征图分别经过一池化层处理,得到一局部最优特征;
14)将步骤13)中输出的各局部最优特征输入全连接层进行连接;
15)将步骤14)的输出特征,经过sigmoid函数输出二分类概率值大小,得到每一企业舆情样本数据的预测分类标签;
16)将预测分类标签与实际的分类标签进行比较,根据损失函数求得损失,采用反向传播算法对该卷积神经网络的参数进行梯度更新;
17)重复上述步骤11)~16)直到满足设定条件,将训练得到的卷积神经网络作为企业舆情情感分类模型。
3.如权利要求1或2所述的方法,其特征在于,该企业舆情情感分类模型包括三个并列的卷积层,即卷积层1、卷积层2和卷积层3;其中,卷积层1中的过滤器尺寸为2个词单位长度,数量为100个;卷积层2中的过滤器尺寸为3个词单位长度,数量为100个;卷积层3中的过滤器尺寸为4个词单位长度,数量为100个。
4.如权利要求2所述的方法,其特征在于,步骤16)中,使用Adam优化器或RMSprop优化器实现反向传播过程;损失函数为categorical_crossentropy多类的对数损失函数。
5.如权利要求1所述的方法,其特征在于,采用词嵌入技术对企业舆情文本进行分词并生成每一分词的词向量;然后根据各分词的词向量生成对应的词向量矩阵;其中各分词的词向量维度相同。
6.如权利要求1或5所述的方法,其特征在于,根据企业舆情文本中的分词在该企业舆情文本中的位置,对该企业舆情文本中的分词的词向量进行排序,得到该企业舆情文本对应的张量,将该张量输入该企业舆情情感分类模型的各卷积层进行特征提取。
7.一种基于卷积神经网络的企业舆情情感分类系统,其特征在于,包括一企业舆情情感分类模型;该企业舆情情感分类模型的第一层为词嵌入层,第二层为多个并列的卷积层,第三层为多个并列的池化层,第四层为全连接层;其中,
词嵌入层,用于对待分类的企业舆情文本进行预处理生成对应的词向量矩阵;
卷积层,用于对输入的词向量矩阵进行特征提取,得到一文本词向量特征图并输入到一对应的池化层;
池化层,用于提取所输入文本词向量特征图的平均特征和最强特征,并将其输入到全连接层;
全连接层,用于根据各池化层输入的特征对待分类的企业舆情文本进行分类,得到待分类的企业舆情文本的舆情类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中兴通网络科技股份有限公司,未经北京中兴通网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910207891.0/1.html,转载请声明来源钻瓜专利网。





