[发明专利]一种基于循环神经网络的命名实体识别方法在审
| 申请号: | 202111415628.4 | 申请日: | 2021-11-25 |
| 公开(公告)号: | CN114358008A | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 刘杰;陈斌 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04 |
| 代理公司: | 上海德誉达专利代理事务所(普通合伙) 31426 | 代理人: | 曹翠翠 |
| 地址: | 150001 黑龙江省哈尔*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 循环 神经网络 命名 实体 识别 方法 | ||
本发明公开了一种基于循环神经网络的命名实体识别方法,涉及人工智能技术领域,具体为一种基于循环神经网络的命名实体识别方法,具体包括如下步骤:S1、首先对命名实体识别任务数据集中的数据进行整理,统计出数据集中实体的类型,并采用BIO标注策略进行数据预处理,处理后的数据分为两列,第一列为数据集中的字符,第二列为对应的标注标签;S2、获取当前序列文本的上下文特征;S3、获得前位置字符的标签。本发明提出的RFLSTM模型主要是考虑到下面的情况:有A,B两个信息,A信息是我们记忆的信息,B信息是我们新输入的信息,B信息会和A信息产生关联,A信息将会被遗忘门丢弃。
技术领域
本发明涉及人工智能领域,尤其涉及一种基于循环神经网络的命名实体识别方法
背景技术
命名实体识别是专业术语,源自1995年的第六届信息理解会议。命名实体识别通常指文本中具有特定意义或指代性强的实体,通常包括人名、组织机构名、地名等专有词汇,以及日期、时间、数量、货币、比例、数值等数量短语。命名实体识别旨在自动识别文本中表示命名实体的成分,并对其进行分类。命名实体识别一直是信息检索与自然语言处理中的一个重要研究领域,识别出的命名实体是构建许多智能服务的基础,是信息提取、问答系统、句法分析、机器翻译、知识图谱构建等应用领域的重要基础工具,在自然语言处理技术走向实用化的过程中占有重要地位。
传统的命名实体识别模型长短期记忆网络(Long Short Term Memory)是为了解决循环神经网络存在的长期依赖问题而提出来的一种特殊的循环神经网络,它具有称为“门”的机制,用来调节信息流。这些“门”可以知道序列中哪些信息可以保留,哪些信息可以删除,LSTM主要由遗忘门、输入门、输出门和细胞状态组成。当前细胞状态经过遗忘门控制的上一个细胞的状态加上输入门控制的新输入的信息相加得到,其中遗忘的信息和新输入的信息是独立的。在我们人类的记忆过程中,遗忘与新输入的信息是有关的,如果新的信息刺激到我们以前记忆的信息,那以前的信息会被加强记忆,如果新的信息和我们以前记忆的信息没有任何关联,那以前的信息会被逐渐地忘记,考虑到我们人类上述的记忆特点,本发明在LSTM模型门机制的基础上,提出改进后的记忆优先的模型RFLSTM模型。
发明内容
本发明要解决的技术问题克服现有的缺陷,提供一种基于循环神经网络的命名实体识别方法,可以有效解决背景技术中的问题。
为了解决上述技术问题,本发明提供了如下的技术方案:
一种基于循环神经网络的命名实体识别方法,具体包括如下步骤:
S1、首先对命名实体识别任务数据集中的数据进行整理,统计出数据集中实体的类型,并采用BIO标注策略进行数据预处理,处理后的数据分为两列,第一列为数据集中的字符,第二列为对应的标注标签;
S2、获取当前序列文本的上下文特征:
S21、设置输入门it、遗忘门ft和输出门ot,三种门都是由当前输入xt、上一个隐藏层和上一个细胞状态Ct-1控制的;
S22、首先由xt和输入门it得到新信息Cnew;
S23、新信息再与上一个细胞状态Ct-1融合,得到融合后的新信息,再经过遗忘门ft,得到遗忘后的新信息;
S24、再与前面的新信息Cnew融合得到当前的细胞状态Ct,当前细胞状态再经过输出门控制得到当前隐藏层的输出当前序列文本的特征,此时得到的从前往后的序列文本特征,要想获得文本的上下文特征信息,还需要从后往前计算一遍,将两遍得到的隐藏层相加,得到当前序列文本的上下文特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111415628.4/2.html,转载请声明来源钻瓜专利网。





