[发明专利]一种基于句法依存关系的命名实体识别方法在审
申请号: | 202010556881.0 | 申请日: | 2020-06-16 |
公开(公告)号: | CN111783461A | 公开(公告)日: | 2020-10-16 |
发明(设计)人: | 李建强;刘雅琦;白骏 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 句法 依存 关系 命名 实体 识别 方法 | ||
1.一种基于句法依存关系的命名实体识别方法,其特征在于,包括如下步骤:
步骤S1,在模型训练阶段,首先用预训练过的Word2vec把one-hot单词向量映射到定义好的低维空间,得到每个单词的词向量;
步骤S2,使用双向长短期记忆网络对句子中每个时间步的词向量分别进行前向和后向的编码,并拼接得到拥有上下文信息的全局特征;
步骤S3,用句法分析技术得到每个句子的句法依存树,计算树上两两单词之间的最短依赖路径;
步骤S4,根据最短依赖路径得到每个单词的自顶向下以及自底向上的特征序列并输入LSTM网络,计算得到单词局部特征;
步骤S5,通过局部特征点积来计算两两单词之间的关系权重并进行归一化;
步骤S6,使用自注意力机制以归一化的关系权重将单词之间的局部关系特征融入全局特征中,得到融合特征;
步骤S7,根据融合特征初步预测序列标签,使用CRF对预测序列进行精修,得到最终标签序列;
步骤S8,在模型测试阶段,使用上述步骤训练好的网络来进行命名实体识别。
2.根据权利要求1所述的基于句法依存关系的命名实体识别方法,其特征在于,
所述步骤S1中在模型训练阶段,首先用预训练过的Word2vec把one-hot单词向量映射到定义好的低维空间,得到每个单词的词向量包括:
记词典大小为V,采用预训练过的Word2vec把维度为V的one-hot单词向量映射到定义好的低维空间,输出的词向量维度记为d;具体的,对于长度为T的输入样本序列{w1,...,wt,...wT},其中wt∈R1×V,嵌入层的输出记为{x1,...,xt,...xT},其中xt∈R1×d。
3.根据权利要求1所述的基于句法依存关系的命名实体识别方法,其特征在于,
所述步骤S2中使用双向长短期记忆网络(Bi-LSTM)对句子中每个时间步的词向量分别进行前向和后向的编码,并拼接得到拥有上下文信息的全局特征包括:
使用隐藏单元的个数为h1的双向长短期记忆网络(Bi-LSTM1)对给定时间步t的输入xt进行前向和后向的编码,并将该时间步正向隐藏状态记为反向隐藏状态记为然后,连结两个方向的隐藏状态和来得到隐藏状态便是拥有给定时间步t上下文信息的全局特征,对于输入序列{x1,x2,...xT},记Bi-LSTM1的输出特征为
4.根据权利要求3所述的基于句法依存关系的命名实体识别方法,其特征在于,
所述步骤S3中用句法分析技术得到每个句子的句法依存树,计算树上两两单词之间的最短依赖路径包括:
对于输入样本序列{w1,w2,...wT},使用依存语法分析技术对其进行句法分析,得到样本序列的依存句法树;对于输入序列中任意两个单词a与b,他们之间的最短依存路径(SDP)为{a,a1,...,am,c,bn,...,b1,b},其中c表示它们在依存句法树中的最低共同祖先,a1,...,am表示SDP上a和c之间的单词,b1,...,bn表示b和c之间的单词;若a与b表示同一个单词,则SDP记为{a,b}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010556881.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑用桁架木模装配机
- 下一篇:一种电动牙刷及其刷牙启动方法