[发明专利]一种基于多头自注意力机制的动态元嵌入方法有效
| 申请号: | 202010367701.4 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111581351B | 公开(公告)日: | 2023-05-02 |
| 发明(设计)人: | 王春辉;胡勇 | 申请(专利权)人: | 识因智能科技(北京)有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/30;G06N3/0464;G06N3/08;G06N3/048 |
| 代理公司: | 北京中北知识产权代理有限公司 11253 | 代理人: | 卢业强 |
| 地址: | 102600 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多头 注意力 机制 动态 嵌入 方法 | ||
1.一种基于多头自注意力机制的动态元嵌入方法,其特征在于,包括以下步骤:
步骤1,将输入句子中的每个词表示为词向量序列wi,j为嵌入第i个嵌入集的第j个词,j=1,2,…,s,s为句子中词的数量,i=1,2,…,n,n为嵌入集的数量;
步骤2,通过一个全连接层将每个词向量映射到同一维度,表示为:
w′i,j=piwi,j+ci (1)
其中,pi、ci为学习参数;
步骤3,基于多头自注意力机制计算嵌入矩阵,按(2)~(5)式得到元嵌入表示的词向量矩阵B=[w″i,j]n×s:
XR×1=(x1,x2,…,xR)T (5)
其中,ar、br和xr为学习参数,r=1,2,…,R,R为多头自注意力机制的计算次数,A1×R为嵌入矩阵,φ为softmax或sigmoid门控函数。
2.根据权利要求1所述的基于多头自注意力机制的动态元嵌入方法,其特征在于,所述方法还包括降低输入句子噪声的预处理步骤。
3.根据权利要求1所述的基于多头自注意力机制的动态元嵌入方法,其特征在于,所述方法还包括将训练模型的损失函数增加一个惩罚项NewPT:
其中,表示求矩阵的Frobenius范数,I为单位矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于识因智能科技(北京)有限公司,未经识因智能科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010367701.4/1.html,转载请声明来源钻瓜专利网。





