[发明专利]一种基于网络特征融合的文本分类方法有效
申请号: | 202110266934.X | 申请日: | 2021-03-12 |
公开(公告)号: | CN112836056B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 覃晓;廖兆琪;元昌安;乔少杰 | 申请(专利权)人: | 南宁师范大学;成都信息工程大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F18/2415;G06F18/25;G06N3/0442;G06N3/045;G06N3/0464;G06N3/08 |
代理公司: | 北京正华智诚专利代理事务所(普通合伙) 11870 | 代理人: | 杨浩林 |
地址: | 530001 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 特征 融合 文本 分类 方法 | ||
1.一种基于网络特征融合的文本分类方法,其特征在于,包括以下步骤:
S1、对待分类文本进行预处理,并通过词向量表示方法将预处理后的文本数据集处理为词向量集;
S2、将词向量集拼接为矩阵,并将矩阵输入至Res2Net网络中进行训练,输出得到文本数据集的局部特征;
S3、将词向量集输入至BiLSTM网络中进行训练,输出得到文本数据集的上下文特征;
S4、采用CRF条件随机场打分机制对文本数据集的上下文特征进行打分,选取得分最高的标签序列集作为文本数据集的最佳上下文特征序列集合;
S5、将文本数据集的局部特征和最佳上下文特征进行拼接融合,得到融合特征;
S6、将融合特征输入至softmax分类器中进行分类,得到文本分类结果;
所述步骤S4中采用CRF条件随机场打分机制对文本数据集的上下文特征进行打分的公式为:
其中S(X,y)表示BiLSTM网络的输入词向量序列X对应输出标签序列为y的得分,表示第i个标签tagi转移到第i+1个标签tagi+1的转移概率,表示输入词向量序列X中第i个词vi映射到第i个标签tagi的标量化概率;
对于输入词向量序列X的多个输出标签序列y的得分进行归一化,得到:
其中p(y|X)表示对于输入词向量序列X的多个输出标签序列y的得分,y~表示属于所有可能的输出标签序列中的某个具体输出标签序列,Yx表示所有可能的输出标签序列,对上式进行优化对数似然函数得到:
2.根据权利要求1所述的文本分类方法,其特征在于,所述步骤S1中对待分类文本进行预处理的方法具体为:去除无用的符号、保留文本数据集只含有中文以及去除停用词。
3.根据权利要求1所述的文本分类方法,其特征在于,所述步骤S2中的Res2Net网络包括依次连接的第一1×1卷积层、3×3卷积层和第二1×1卷积层,每层卷积层均包括relu激活函数,且第二1×1卷积层的relu激活函数之前用残差块进行连接;
所述第一1×1卷积层的通道数为n,并按照通道数将输入矩阵的特征图均分为s组特征,每一组特征的通道数为w,则n=s×w,将均分后的每一组特征记为xi,其中i∈{1,2,...,s};
所述3×3卷积层针对均分后的每一组特征xi,除了第一组特征不进行卷积操作以外,其他组特征都对应进行卷积操作ki(·),记yi为卷积操作ki(·)的输出,则从第二组特征开始,每一次卷积操作ki(·)前,会将上一组的输出yi-1与当前的特征xi进行残差连接,并作为卷积操作ki(·)的输入,直到最后一组特征;
所述第二1×1卷积层将3×3卷积层的每一组输出yi进行通道拼接,对多尺度特征进行融合并输出得到文本数据集的局部特征。
4.根据权利要求3所述的文本分类方法,其特征在于,所述步骤S2中Res2Net网络的目标函数为:
其中xi表示均分后的第i组特征,ki(·)表示对第i组特征进行的卷积操作,yi表示第i组特征经卷积操作后的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南宁师范大学;成都信息工程大学,未经南宁师范大学;成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110266934.X/1.html,转载请声明来源钻瓜专利网。