[发明专利]一种识别触发词的方法及装置有效

专利信息
申请号: 201911242217.2 申请日: 2019-12-06
公开(公告)号: CN111126056B 公开(公告)日: 2023-05-09
发明(设计)人: 徐猛;付骁弈 申请(专利权)人: 北京明略软件系统有限公司
主分类号: G06F40/289 分类号: G06F40/289;G06F40/30
代理公司: 北京安信方达知识产权代理有限公司 11262 代理人: 戴仕琴;栗若木
地址: 100084 北京市海淀区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 识别 触发 方法 装置
【说明书】:

一种识别触发词的方法,包括:对目标文本进行分词并确定所述目标文本的各分词中每两个分词之间的关联关系,并根据所确定的关联关系得到关系矩阵;对目标文本的每个分词进行编码映射,获取所述目标文本的向量并输入循环神经网络,得到所述目标文本的编码特征矩阵;根据所得到的编码特征矩阵进行语义映射,得到所述目标文本的语义特征;根据所得到的关系矩阵和所述目标文本在多个语义空间的特征,采用图神经网络识别所述目标文本中的触发词。本申请能够提取多个语义空间的特征,对文本的语义提取更加充分。

技术领域

本文涉及计算机领域,尤指一种识别触发词的方法及装置。

背景技术

互联网上每天都会产生大量的新闻数据,描述许多已经发生的事件。但由于事件种类繁多,无法快速而且准确地分辨事件的类型。对发生的公共事件或者特定行业内所发生的事件进行区分和掌握,不仅有助于实时把握事件的发展趋势以及整个行业的发展方向,也可辅助高层决策,降低风险,具有重要的实际应用价值和研究意义。而且事件的类型往往可以从一些关键词中获取,比如”枪杀”,“袭击”等,这类词就被称为触发词。因此快速准确地识别出这些触发词就极其重要。

现有技术中采用的基于注意力机制神经网络和机器学习的方法虽然也可以提取特征,但是无法充分利用触发词与句子中其他词汇之间的关系,因此特征提取比较单一。

另外,现有技术中还采用的基于规则的方法往往需要领域专家撰写一定量的规则,需要一定量的人力和财力。同时,不同领域的规则大不相同,很难做到通用性。

发明内容

本申请提供了一种识别触发词的方法及装置能够达到提取多个语义空间的特征的目的。

本申请提供了一种识别触发词的方法,包括对目标文本进行分词并确定所述目标文本的各分词中每两个分词之间的关联关系,并根据所确定的关联关系得到关系矩阵;对目标文本的每个分词进行编码映射,获取所述目标文本的向量并输入循环神经网络,得到所述目标文本的编码特征矩阵;根据所得到的编码特征矩阵进行语义映射,得到所述目标文本的语义特征;根据所得到的关系矩阵和所述目标文本的语义特征,识别所述目标文本中的触发词。

在一个示例性实施例中,上述确定所述目标文本的各分词之间的关联关系,包括:对每个分词进行词性标注和依存句法分析,得到所述目标文本所有分词的依存关系树;根据所得到的依存关系树确定所述目标文本的各分词中每两个分词之间的关联关系。

在一个示例性实施例中,上述对目标文本的每个分词进行编码映射,获取目标文本的向量,包括:对目标文本的每个分词进行编码映射,获取每个分词的词向量、词性向量、及位置向量,将所述词向量、词性向量、及位置向量进行合并得到所述目标文本的向量。

在一个示例性实施例中,上述获取每个分词的词向量、词性向量、及位置向量,包括:获取所述目标文本的每个分词的分词ID,根据所述分词ID和所述目标文本的每个分词的初始化向量,得到所述目标文本的词向量;获取所述目标文本的每个分词的词性ID,根据所述词性ID和预设的词性向量得到所述目标文本的词性向量;获取所述目标文本的每个分词的位置ID,根据所述位置ID和预设的位置向量得到所述目标文本的词性向量。

在一个示例性实施例中,上述获取所述目标文本的向量并输入循环神经网络,得到所述目标文本的编码特征矩阵,包括:获取所述目标文本的向量并输入双向LSTM网络,将得到的两个方向的输出结果进行合并,得到所述目标文本的编码特征矩阵。

在一个示例性实施例中,上述根据所得到的编码特征矩阵进行语义映射,得到所述目标文本的语义特征,包括:将所得到的编码特征矩阵进行指定数量的矩阵转换得到对应的指定数量的转换矩阵,并分别映射到多个语义空间,得到与所述转换矩阵对应的多个映射特征;将所得到的多个映射特征中的指定映射特征进行矩阵运算,得到多头注意力权重特征;根据所得到的多头注意力权重特征与所述多个映射特征中的一个指定映射特征得到所述目标文本的多个语义空间特征,并对所得到的多个语义空间进行维度转换,得到所述目标文的语义特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911242217.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top