[发明专利]一种基于循环神经网络的命名实体识别方法在审

申请号：	202111415628.4	申请日：	2021-11-25
公开（公告）号：	CN114358008A	公开（公告）日：	2022-04-15
发明（设计）人：	刘杰;陈斌	申请（专利权）人：	哈尔滨工程大学
主分类号：	G06F40/295	分类号：	G06F40/295;G06N3/04
代理公司：	上海德誉达专利代理事务所(普通合伙) 31426	代理人：	曹翠翠
地址：	150001 黑龙江省哈尔***	国省代码：	黑龙江;23
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于循环神经网络命名实体识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于循环神经网络的命名实体识别方法，涉及人工智能技术领域，具体为一种基于循环神经网络的命名实体识别方法，具体包括如下步骤：S1、首先对命名实体识别任务数据集中的数据进行整理，统计出数据集中实体的类型，并采用BIO标注策略进行数据预处理，处理后的数据分为两列，第一列为数据集中的字符，第二列为对应的标注标签；S2、获取当前序列文本的上下文特征；S3、获得前位置字符的标签。本发明提出的RFLSTM模型主要是考虑到下面的情况：有A，B两个信息，A信息是我们记忆的信息，B信息是我们新输入的信息，B信息会和A信息产生关联，A信息将会被遗忘门丢弃。

技术领域

本发明涉及人工智能领域，尤其涉及一种基于循环神经网络的命名实体识别方法

背景技术

命名实体识别是专业术语，源自1995年的第六届信息理解会议。命名实体识别通常指文本中具有特定意义或指代性强的实体，通常包括人名、组织机构名、地名等专有词汇，以及日期、时间、数量、货币、比例、数值等数量短语。命名实体识别旨在自动识别文本中表示命名实体的成分，并对其进行分类。命名实体识别一直是信息检索与自然语言处理中的一个重要研究领域，识别出的命名实体是构建许多智能服务的基础，是信息提取、问答系统、句法分析、机器翻译、知识图谱构建等应用领域的重要基础工具，在自然语言处理技术走向实用化的过程中占有重要地位。

传统的命名实体识别模型长短期记忆网络(Long Short Term Memory)是为了解决循环神经网络存在的长期依赖问题而提出来的一种特殊的循环神经网络，它具有称为“门”的机制，用来调节信息流。这些“门”可以知道序列中哪些信息可以保留，哪些信息可以删除，LSTM主要由遗忘门、输入门、输出门和细胞状态组成。当前细胞状态经过遗忘门控制的上一个细胞的状态加上输入门控制的新输入的信息相加得到，其中遗忘的信息和新输入的信息是独立的。在我们人类的记忆过程中，遗忘与新输入的信息是有关的，如果新的信息刺激到我们以前记忆的信息，那以前的信息会被加强记忆，如果新的信息和我们以前记忆的信息没有任何关联，那以前的信息会被逐渐地忘记，考虑到我们人类上述的记忆特点，本发明在LSTM模型门机制的基础上，提出改进后的记忆优先的模型RFLSTM模型。

发明内容

本发明要解决的技术问题克服现有的缺陷，提供一种基于循环神经网络的命名实体识别方法，可以有效解决背景技术中的问题。

为了解决上述技术问题，本发明提供了如下的技术方案：

一种基于循环神经网络的命名实体识别方法，具体包括如下步骤：

S1、首先对命名实体识别任务数据集中的数据进行整理，统计出数据集中实体的类型，并采用BIO标注策略进行数据预处理，处理后的数据分为两列，第一列为数据集中的字符，第二列为对应的标注标签；

S2、获取当前序列文本的上下文特征：

S21、设置输入门i_t、遗忘门f_t和输出门o_t，三种门都是由当前输入x_t、上一个隐藏层和上一个细胞状态C_t-1控制的；

S22、首先由x_t和输入门i_t得到新信息C_new；

S23、新信息再与上一个细胞状态C_t-1融合，得到融合后的新信息，再经过遗忘门f_t，得到遗忘后的新信息；

S24、再与前面的新信息C_new融合得到当前的细胞状态C_t，当前细胞状态再经过输出门控制得到当前隐藏层的输出当前序列文本的特征，此时得到的从前往后的序列文本特征，要想获得文本的上下文特征信息，还需要从后往前计算一遍，将两遍得到的隐藏层相加，得到当前序列文本的上下文特征；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载