[发明专利]文本情感分类方法在审
申请号: | 201910452874.3 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110134793A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 张小松;范文慧;牛伟纳;任仲蔚;潘文强;蓝皓月 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词向量 文本数据 文本情感分类 预处理 神经网络 拼接 分类处理 分类能力 数据模型 语义分析 中文词语 数据集 小样本 优化 样本 概率 | ||
1.文本情感分类方法,包括有对待处理的文本数据进行预处理,其特征为:
A.在所述的预处理中包括了通过不同的现有的词向量模型对待处理的文本数据进行预训练,将同一个词经不同的词向量模型预训练后所对应的所有不同的词向量表达拼接为一个整体,形成优化后的词向量;
B.将所述优化后的词向量输入到不同的神经网络中,分别提取待处理的文本数据的不同特征;
C.将不同神经网络提取的所有特征拼接后进行分类处理,得到待处理的文本数据的每个处理样本属于不同情感类别的概率值。
2.如权利要求1所述的文本情感分类方法,其特征为:步骤B中所述不同的神经网络包括卷积神经网络和循环神经网络。
3.如权利要求2所述的文本情感分类方法,其特征为:所述的卷积神经网络通过不同尺寸的卷积核来提取所述文本数据中不同尺寸的特征,并将提取的所述特征经RELU函数非线性激活之后再进行一次topK的池化操作进一步提取其特征,然后将进一步提取的特征拼接起来输出到步骤C中。
4.如权利要求2所述的文本情感分类方法,其特征为:在所述的循环神经网络中依次通过双向LSTM网络和双向GRU网络来提取所述文本数据的上下文特征,然后将提取的上下文特征输出到步骤C中。
5.如权利要求1所述的文本情感分类方法,其特征为:在步骤C中所述的分类处理中包括两个全连接层,并在每个全连接层后对拼接后的特征数据进行正则化和非线性变换,然后通过分类器输出待处理的文本数据的每个处理样本属于不同情感类别的概率值。
6.如权利要求1至5之一所述的文本情感分类方法,其特征为:步骤A中将所述的所有不同的词向量表达通过串联拼接为一个整体。
7.如权利要求1至5之一所述的文本情感分类方法,其特征为:在步骤B所述的将优化后的词向量输入到不同的神经网络之前,通过spatialdropout方法随机置零一部分优化后的词向量数据。
8.如权利要求1至5之一所述的文本情感分类方法,其特征为:步骤A中,将不同的词向量模型预训练后所得到的所有不同的词向量表达先进行格式统一后,再拼接为一个整体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910452874.3/1.html,转载请声明来源钻瓜专利网。