[发明专利]一种基于特征可控融合的深度表示学习方法有效
| 申请号: | 201910989654.4 | 申请日: | 2019-10-17 |
| 公开(公告)号: | CN110866542B | 公开(公告)日: | 2021-11-19 |
| 发明(设计)人: | 饶元;冯聪;吴连伟 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 朱海临 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 可控 融合 深度 表示 学习方法 | ||
1.一种基于特征可控融合的深度表示学习方法,其特征在于,包括以下步骤:
步骤0:利用分词工具将评论数据分为单词序列,并给出对应的标签;
步骤1:给定长度为N的评论数据其中xi代表评论中的一个单词,yi表示该单词对应的标签,且yi∈{B,I,O};对于标签集合{B,I,O},B、I、O分别代表评价对象的开头单词,评价对象的内部单词和非评价对象单词;
步骤2:采用预训练的BERT作为词嵌入工具,获取单词嵌入向量;
步骤3:使用BERT作为词嵌入工具,BERT是由多层transformer组成的模型;
步骤4:采用线性加权的方法联合BERT多层transformer输出特征作为单词嵌入向量;
步骤5:将生成的单词嵌入向量作为模型的输入;
步骤6:采用BIGRU算法输入单词嵌入向量,并获取单词初步的语义表示;
步骤7:采用多尺度CNN算法抽取局部特征;
步骤8:将步骤7获取的不同尺度的局部特征进行融合,并使用LayerNorm进行归一化处理,从而获取单词的局部特征表示;
步骤9:使用步骤6生成的单词初步的语义表示作为输入,采用BIGRU抽取更抽象的序列特征;
步骤10:使用多头交互线性注意力机制分别从不同的特征表示角度来提取上下文摘要,所生成的两种不同特征表示的上下文摘要充分利用了上下文特征;
步骤11:获取统一的上下文摘要,对序列特征偏向上下文摘要以及局部特征偏向上下文摘要进行选择性融合,得到上下文摘要si;
步骤12:针对步骤11中获取的上下文摘要si,以及步骤7-9中获取的局部特征序列特征使用另外的三个门控制信息的流入,并得到单词的最终表示Hi;
步骤13:通过步骤12,获取了当前单词的最终表示Hi,进一步,将Hi输入全连接层并使用Softmax激活函数获取最终的预测标签。
2.根据权利要求1所述基于特征可控融合的深度表示学习方法,其特征在于,步骤7中,多尺度CNN由三组不同卷积核大小的CNN组成,通过多尺度CNN分别抽取不同尺度的局部特征,其中第一组由一个1*1的卷积网络组成,第二组由一个1*1卷积接3*3卷积组成,第三组由一个1*1卷积接5*5卷积组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910989654.4/1.html,转载请声明来源钻瓜专利网。





