[发明专利]事件语句处理方法、装置、计算机设备和可读存储介质有效
申请号: | 201910948382.3 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110674303B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 徐猛;付骁弈 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/31 |
代理公司: | 北京超成律师事务所 11646 | 代理人: | 孔默 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 事件 语句 处理 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种事件语句处理方法,其特征在于,包括:
对事件语句中的每个单词进行映射,得到所述事件语句对应的向量化语句;
对所述向量化语句进行线性变换,并将线性变换后的向量化语句映射到多个语义空间进行处理,以得到深层向量化语句;
所述将线性变换后的向量化语句映射到多个语义空间进行处理,以得到深层向量化语句的步骤包括:
使用多头自注意力机制,将线性变换后的向量化语句复制到多个语义空间;
针对于每个所述语义空间,在该语义空间中,随机初始化得到一目标向量化语句,将该语义空间中的线性变换后的向量化语句与所述目标向量化语句进行第一矩阵运算,得到第一语义矩阵;
将所述第一语义矩阵与该语义空间中的线性变换后的向量化语句进行第二矩阵运算,得到第二语义矩阵;
将每个所述语义空间的第二语义矩阵进行拼接,得到所述深层向量化语句;
将所述深层向量化语句与所述向量化语句进行拼接,得到拼接后的语句向量;
对所述语句向量进行编码,以得到所述事件语句的编码特征;利用训练得到的事件检测模型,对所述事件语句的编码特征进行解码,得到所述事件语句的事件主体,并对所述事件语句的编码特征进行事件类型的检测,得到所述事件语句的事件类型。
2.根据权利要求1所述的事件语句处理方法,其特征在于,所述对所述语句向量进行编码,以得到所述事件语句的编码特征的步骤包括:
根据双向长短期记忆网络对所述语句向量进行编码,得到第一方向和第二方向的输出;
将所述第一方向和第二方向的输出进行拼接,得到所述事件语句的编码特征。
3.根据权利要求1所述的事件语句处理方法,其特征在于,所述事件检测模型包括单向长短期记忆网络;
所述对所述事件语句的编码特征进行解码,得到所述事件语句的事件主体的步骤包括:
利用所述单向长短期记忆网络对所述事件语句的编码特征进行解码,得到所述事件语句中每一个单词属于事件主体的概率;
根据所述事件语句中每一个单词属于事件主体的概率,得到所述事件语句的事件主体。
4.根据权利要求1所述的事件语句处理方法,其特征在于,所述事件检测模型还包括卷积神经网络和全连接网络;
所述对所述事件语句的编码特征进行事件类型的检测,得到所述事件语句的事件类型的步骤包括:
根据所述卷积神经网络对所述事件语句的编码特征进行池化操作,得到池化操作后的编码特征;
将池化操作后的编码特征输入至所述全连接网络,得到所述事件语句属于每个事件类型的概率;
根据所述事件语句属于每个事件类型的概率,得到所述事件语句的事件类型。
5.根据权利要求1所述的事件语句处理方法,其特征在于,所述事件检测模型通过以下步骤训练得到:
对训练数据集中的每个事件语句进行事件主体标记和事件类型标记,得到标记后的事件语句;
针对于每个所述标记后的事件语句,将该标记后的事件语句的编码特征输入至待训练的事件检测模型进行训练,并基于预设损失函数,通过反向传播算法对所述待训练的事件检测模型的参数进行调整,直到所述预设损失函数的输出小于预设阈值。
6.根据权利要求5所述的事件语句处理方法,其特征在于,所述训练数据集中的每个事件语句的事件主体标记通过BIO标注方法实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910948382.3/1.html,转载请声明来源钻瓜专利网。