[发明专利]一种基于CNN与Bi-GRU的文本分类方法在审

专利信息
申请号: 201911247824.8 申请日: 2019-12-09
公开(公告)号: CN111144094A 公开(公告)日: 2020-05-12
发明(设计)人: 姬少培;颜亮;董贵山;刘栋 申请(专利权)人: 中国电子科技集团公司第三十研究所
主分类号: G06F40/211 分类号: G06F40/211;G06F40/30;G06K9/62;G06N3/04;G06N3/08
代理公司: 成都九鼎天元知识产权代理有限公司 51214 代理人: 邓世燕
地址: 610000 *** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 cnn bi gru 文本 分类 方法
【权利要求书】:

1.一种基于CNN与Bi-GRU的文本分类方法,其特征在于:包括如下步骤:

步骤一、对文本数据进行卷积神经网络建模,得到包含局部隐含信息的第一种文本特征表达式;

步骤二、对文本数据进行Bi-GRU神经网络建模,得到包含整个句子两个方向的序列信息的第二种文本特征表达式;

步骤三、对步骤一和步骤二得到的两种文本特征表达式进行特征融合,利用LSSVM分类器进行分类。

2.根据权利要求1所述的一种基于CNN与Bi-GRU的文本分类方法,其特征在于:步骤一所述对文本数据进行卷积神经网络建模的方法为:

1.1)建立两种不同类型的过滤器,一种为整体过滤器,用于匹配整个词向量,另一种为单维过滤器,用于在词向量的每一维上进行匹配;

1.2)对卷积层输出向量使用不同池化操作;

1.3)建立多角度的卷积神经网络,输入文本进行训练;

1.4)训练完成后,去掉最后一层softmax层,输入文本,输出为第一种文本特征表达式。

3.根据权利要求2所述的一种基于CNN与Bi-GRU的文本分类方法,其特征在于:所述整体过滤器对整个词向量进行匹配的方法为:

对于句子输入Input∈Rlength×Dim是length个词语序列,每一个词语均由Dim维词向量表示,Inputi∈RDim代表词语序列中第i个词向量,Inputi:j代表第i到j个包括第j个词向量的连接,

设一个整体过滤器F为四元组ws,wf,bf,hf,其中ws为滑窗宽度、wf∈Rws×Dim为过滤器F的权重向量,bf∈R为偏置,hf为激活函数;

当过滤器F应用于输入词语序列Input时,wf与Input内每一个长度为ws的词向量窗口进行内积,加上偏置bf,应用激活函数hf,得到输出向量outF∈R1+length-ws;其中第i项outF[i]=hf(wf·Inputi:i+ws-1+bf),其中i∈[1,1+len-ws]。

4.根据权利要求3所述的一种基于CNN与Bi-GRU的文本分类方法,其特征在于:所述单维过滤器对每一维词向量进行匹配的方法为:

设一个单维过滤器F[m]由ws,wfm,bfm,hfm元组表示,其中ws为滑窗宽度,wfm∈Rws为过滤器F[m]的权重向量,bfm为偏置,hfm为激活函数;

当过滤器F[m]应用于词向量的第m维时,得到输出向量其中第i项其中,代表第i个词向量的第m维,代表第i到j个包括第j个词向量的第m维。

5.根据权利要求4所述的一种基于CNN与Bi-GRU的文本分类方法,其特征在于:所述对卷积层输出向量使用不同池化操作的方法为:

设group(ws,pooling,Input)是针对输入句子Input进行滑窗宽度ws的卷积操作和池化操作的操作对象,其中pooling∈{max,min,mean};group(ws,pooling,Input)的卷积层具有Num个过滤器,则池化层的输出向量为oG∈Rnum,其中第j项

6.根据权利要求2所述的一种基于CNN与Bi-GRU的文本分类方法,其特征在于:步骤二所述对文本数据进行Bi-GRU神经网络建模的方法为:

2.1)建立Bi-GRU循环神经网络模型结构,对于输入文本前向后向序列分别训练一层GRU循环神经网络,并连接同一个输出层,利用该结构对文本进行训练;

2.2)训练完成后,去掉最后一层softmax层,输入文本,输出为第二种文本特征表达式。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第三十研究所,未经中国电子科技集团公司第三十研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911247824.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top