[发明专利]一种基于ERNIE-BiGRU的中文文本分类方法在审
| 申请号: | 202010364840.1 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111581383A | 公开(公告)日: | 2020-08-25 |
| 发明(设计)人: | 钱叶;唐小岚 | 申请(专利权)人: | 上海电力大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06N3/04;G06N3/08 |
| 代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 孙永申 |
| 地址: | 200090 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ernie bigru 中文 文本 分类 方法 | ||
1.一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,该方法包括以下步骤:
步骤1:对待中文文本分类的数据集进行预处理,得到经过预处理的数据集,并建立ERNIE-BiGRU整体模型;
步骤2:将经过预处理的数据集输入ERNIE-BiGRU整体模型中的ERNIE预训练模型,得到句子级的词向量表示;
步骤3:将句子级的词向量表示输入ERNIE-BiGRU整体模型中的BiGRU层进一步提取句子中每个词的上下文信息;
步骤4:将句子级的词向量表示和句子中每个词的上下文信息输入ERNIE-BiGRU整体模型中的softmax层,得到最终中文文本分类结果。
2.根据权利要求1所述的一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,所述的步骤1中的预处理包括针对数字、英文和特殊符号的数据清洗处理。
3.根据权利要求1所述的一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,所述的步骤2中的ERNIE预训练模型由Transformer编码器和知识整合组成。
4.根据权利要求1所述的一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,所述的步骤2包括以下分步骤:
步骤201:设置ERNIE-BiGRU整体模型中的ERNIE预训练模型的参数,并将经过预处理的数据集输入ERNIE-BiGRU整体模型中的ERNIE预训练模型;
步骤202:利用ERNIE预训练模型中的Transformer编码器对文本信息进行编码,得到经过预处理的数据集对应的词向量表示;
步骤203:利用ERNIE预训练模型中的知识整合的基本遮掩在字的层面上对文本进行遮蔽,得到字的层次的知识整合信息;
步骤204:利用ERNIE预训练模型中的知识整合的短语级遮蔽将句子中的短语成分进行遮蔽,得到短语的层次的知识整合信息;
步骤205:利用ERNIE预训练模型中的知识整合的实体级遮蔽将句子中的实体信息进行遮蔽,得到实体的层次的知识整合信息;
步骤206:将字、短语和实体的层次的知识整合信息整合到经过预处理的数据集对应的词向量表示中,得到句子级的词向量表示。
5.根据权利要求4所述的一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,所述的步骤202中的Transformer编码器采用全attention机制的结构。
6.根据权利要求4所述的一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,所述的步骤202中的Transformer编码器的self-attention机制的描述公式为:
式中,Q、K、V均为输入字向量矩阵,dk为输入向量维度,T表示转置。
7.根据权利要求1所述的一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,所述的步骤3中的BiGRU层的基本单元有前向传播的GRU单元和后向传播GRU单元组成。
8.根据权利要求1所述的一种基于ERNIE-BiGRU的中文文本分类方法,其特征在于,所述的步骤3中的BiGRU层,其对应的计算处理公式为:
zt=σ(ωz·[ht-1,xt])
rt=σ(ωr·[ht-1,xt])
式中,ωr、ωz和ω为权值矩阵,xt为t时刻的输入,rt为重置门,zt为更新门,ht-1为前一时刻的隐藏层状态,ht为t时刻的隐藏层状态,σ为sigmoid非线性激活函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电力大学,未经上海电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010364840.1/1.html,转载请声明来源钻瓜专利网。
- 基于Smi2Vec的BiGRU药物毒性预测系统及预测方法
- 基于RoBERTa-BiGRU-LAN模型的中文命名实体识别方法及装置
- 一种基于ERNIE-BiGRU的中文文本分类方法
- 基于深度学习的预测化合物蛋白质亲和力新型编码方案、计算机设备、存储介质
- 一种基于BiGRU的智能电表计量模块故障预测与诊断方法
- 基于边缘注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
- 一种预测化合物蛋白质亲和力的新型深度学习模型、计算机设备、存储介质
- 基于单独注意力机制的预测化合物蛋白质亲和力方法、计算机设备、存储介质
- 一种基于ATAE-BiGRU的文本方面情感分类方法及系统
- 一种基于自注意力机制和BiGRU的文本分类方法





