[发明专利]一种基于多层注意力的通信领域过程类事件语义消岐方法在审
申请号: | 202210161844.9 | 申请日: | 2022-02-22 |
公开(公告)号: | CN114692643A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 王颜颜;李飞;范文斌;周源;张雨晴;冯影;方烨锟 | 申请(专利权)人: | 科大国创云网科技有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 合肥昊晟德专利代理事务所(普通合伙) 34153 | 代理人: | 何梓秋 |
地址: | 230000 安徽省合*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多层 注意力 通信 领域 过程 事件 语义 方法 | ||
1.一种基于多层注意力的通信领域过程类事件语义消岐方法,其特征在于,包括:
S1:事件属性分解
将每一个事件分为三类属性,包括事件文本、事件触发词、事件元素;
S2:特征表示
对事件文本和事件元素基于词汇注意力机制进行表示,事件触发词直接使用词嵌入表示;
S3:事件表示聚合
将事件的三个特征通过异质特征注意力机制进一步整合,获得事件表示向量;
S4:事件消岐
不同事件的表示向量点乘计算事件相似度,根据获取的相似性预测概率得到不同事件的关系标签,从而实现事件语义消歧。
2.根据权利要求1所述的一种基于多层注意力的通信领域过程类事件语义消岐方法,其特征在于:在所述步骤S1中,事件文本是一段短文本序列,记为TexA;事件触发词包括触发类型、触发位置以及触发词汇,记为TriA;事件元素包括元素类型、元素位置以及元素名称,记为ArgA,其中下标A表示事件EventA。
3.根据权利要求2所述的一种基于多层注意力的通信领域过程类事件语义消岐方法,其特征在于:在所述步骤S2中,事件文本通过第一多层注意力模型进行表示,第一多层注意力模型包括三层,分别为故障文本初始嵌入层、第一上下文语义表示层、第一基于词汇注意力机制的文本信息聚合网络。
4.根据权利要求3所述的一种基于多层注意力的通信领域过程类事件语义消岐方法,其特征在于:在故障文本初始嵌入层中,对故障文本进行分词,得到序列长度为Lt的文本通过初始化嵌入矩阵Me,其中,L表示词汇表中的词汇数目,D1表示每一个词汇的初始向量维度,获得文本序列TexA中词汇的语义表征在第一上下文语义表示层中,对文本序列TexA的嵌入表示通过卷积神经网络操作之后第i个词汇的上下文语义表征为:
其中,表示第i个词汇上下k个词汇的拼接嵌入向量,维度为(2k+1)×D1,(2k+1)表示卷积神经网络上下文窗口长度,和是卷积神经网络滤波器的参数矩阵,是权重参数矩阵,是偏置项,ft表示滤波器数目;
在所述第一基于注意力机制的文本信息聚合网络中,定义文本序列TexA中第i个词汇的重要性权重为:
其中,和是注意力机制训练过程中不断训练优化的参数矩阵,下角标a表示以上参数为注意力相关的权重,是权重参数矩阵,是偏置项,和分别是文本序列第i和第j个词汇的重要性,通过Softmax归一化得到最终的词汇注意力权重,Lt是文本序列长度;最终通过将事件文本中每一个词汇的上下文嵌入表示和注意力权重相乘叠加实现信息的聚合,得到事件文本的表示rT:
5.根据权利要求4所述的一种基于多层注意力的通信领域过程类事件语义消岐方法,其特征在于:在所述步骤S2中,事件元素通过第二多层注意力模型进行表示,第二多层注意力模型包括三层,分别为事件元素文本初始嵌入层、第二上下文语义表示层、第二基于词汇注意力机制的事件元素信息聚合网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大国创云网科技有限公司,未经科大国创云网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210161844.9/1.html,转载请声明来源钻瓜专利网。