[发明专利]文本情感分类方法在审

申请号：	201910452874.3	申请日：	2019-05-28
公开（公告）号：	CN110134793A	公开（公告）日：	2019-08-16
发明（设计）人：	张小松;范文慧;牛伟纳;任仲蔚;潘文强;蓝皓月	申请（专利权）人：	电子科技大学
主分类号：	G06F16/35	分类号：	G06F16/35
代理公司：	成都智言知识产权代理有限公司 51282	代理人：	濮云杉
地址：	610000 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	词向量文本数据文本情感分类预处理神经网络拼接分类处理分类能力数据模型语义分析中文词语数据集小样本优化样本概率
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.文本情感分类方法，包括有对待处理的文本数据进行预处理，其特征为：

A.在所述的预处理中包括了通过不同的现有的词向量模型对待处理的文本数据进行预训练，将同一个词经不同的词向量模型预训练后所对应的所有不同的词向量表达拼接为一个整体，形成优化后的词向量；

B.将所述优化后的词向量输入到不同的神经网络中，分别提取待处理的文本数据的不同特征；

C.将不同神经网络提取的所有特征拼接后进行分类处理，得到待处理的文本数据的每个处理样本属于不同情感类别的概率值。

2.如权利要求1所述的文本情感分类方法，其特征为：步骤B中所述不同的神经网络包括卷积神经网络和循环神经网络。

3.如权利要求2所述的文本情感分类方法，其特征为：所述的卷积神经网络通过不同尺寸的卷积核来提取所述文本数据中不同尺寸的特征，并将提取的所述特征经RELU函数非线性激活之后再进行一次topK的池化操作进一步提取其特征，然后将进一步提取的特征拼接起来输出到步骤C中。

4.如权利要求2所述的文本情感分类方法，其特征为：在所述的循环神经网络中依次通过双向LSTM网络和双向GRU网络来提取所述文本数据的上下文特征，然后将提取的上下文特征输出到步骤C中。

5.如权利要求1所述的文本情感分类方法，其特征为：在步骤C中所述的分类处理中包括两个全连接层，并在每个全连接层后对拼接后的特征数据进行正则化和非线性变换，然后通过分类器输出待处理的文本数据的每个处理样本属于不同情感类别的概率值。

6.如权利要求1至5之一所述的文本情感分类方法，其特征为：步骤A中将所述的所有不同的词向量表达通过串联拼接为一个整体。

7.如权利要求1至5之一所述的文本情感分类方法，其特征为：在步骤B所述的将优化后的词向量输入到不同的神经网络之前，通过spatialdropout方法随机置零一部分优化后的词向量数据。

8.如权利要求1至5之一所述的文本情感分类方法，其特征为：步骤A中，将不同的词向量模型预训练后所得到的所有不同的词向量表达先进行格式统一后，再拼接为一个整体。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学，未经电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910452874.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载