[发明专利]基于BERT-A-BiLSTM的多特征专利自动分类算法在审
申请号: | 202110445688.4 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113011527A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 和志强;陈萌;罗长玲;王梦雪;马宁 | 申请(专利权)人: | 河北经贸大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/30;G06F40/44;G06N3/04;G06N3/08 |
代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 陈健阳 |
地址: | 050000 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 bert bilstm 特征 专利 自动 分类 算法 | ||
1.基于BERT-A-BiLSTM的多特征专利自动分类算法,包括BERT-A-BiLSTM的多特征分类算法模型构建、实验设计与对比分析,其特征在于:所述BERT-A-BiLSTM的多特征分类算法模型构建包括“文本向量化表示层”、“文本特征提取层”、“输出层”,所述“文本向量化表示层”的输入数据中的字符映射为“字向量”,“段向量”,“位置向量”,三个向量输入Transformer编码器中,Transformer编码器由多个“注意力机制层(Multi-HeadAttention)”、前馈神经网络层(Feed Forward)和“Layer Normalization层”连接而成,所述“文本特征提取层”由“BiLSTM-Attention的语义特征提取模块”和“CTF-IDF的统计特征提取模块”组成,并通过所述“输出层”进行分类,并通过实验设计,将SVM、Word2vec-BiLSTM、BERT-BiLSTM、BERT、BERT-A-BiLSTM作为对比试验进行对比分析。
2.根据权利要求1所述的基于BERT-A-BiLSTM的多特征专利自动分类算法,其特征在于:所述“Multi-Head Attention特征提取”公式为MultiHead(Q,K,V)=Concat(head1,...,headh)W0,headi=Attention(QWiQ,KWiK,VWiV),W0为head拼接后还原维度的权重矩阵,WiQ,WiK,WiV分别为Q,K,V的权重矩阵,所述“Multi-Head Attention特征提取”中Attention的计算公式,Q,K,V分别为输入query、key、value向量,dk为向量的维度。
3.根据权利要求1所述的基于BERT-A-BiLSTM的多特征专利自动分类算法,其特征在于:所述“BiLSTM-Attention的语义特征提取模块”通过“长短期记忆神经网络(LSTM)”进行语义特征的提取,所述“长短期记忆神经网络(LSTM)”内部公式为输入门:it=σ(Wt·[ht-1,xt]+bi),遗忘门:ft=σ(Wf·[ht-1,xt]+bf),c't=tanh(Wc·[ht-1,xt]+bc),输出门,Ot=σ(WO·[ht-1,xt]+b0),长记忆:短记忆:ft遗忘网络状态的程度,it为忽略本时刻输入的程度,Ot为本时刻网络输出时忽略,ct为本时刻网络状态,ct-1为上一时刻网络状态,c′t为本时刻输入对网络状态的贡献,ht为本时刻网络的输出,ht-1为上一时刻网络的输出,xt为网络的输入。
4.根据权利要求3所述的基于BERT-A-BiLSTM的多特征专利自动分类算法,其特征在于:所述LSTM最终输出的向量集合l为BiLSTM中隐藏层神经元的个数,m为专利文本的长度,代表第k时刻前向LSTM隐层输出的特征向量,代表第k时后向LSTM隐层输出的特征向量,BiLSTM网络k时刻最终的输出
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北经贸大学,未经河北经贸大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110445688.4/1.html,转载请声明来源钻瓜专利网。