[发明专利]一种基于循环神经网络的命名实体识别方法在审
| 申请号: | 202111415628.4 | 申请日: | 2021-11-25 |
| 公开(公告)号: | CN114358008A | 公开(公告)日: | 2022-04-15 |
| 发明(设计)人: | 刘杰;陈斌 | 申请(专利权)人: | 哈尔滨工程大学 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04 |
| 代理公司: | 上海德誉达专利代理事务所(普通合伙) 31426 | 代理人: | 曹翠翠 |
| 地址: | 150001 黑龙江省哈尔*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 循环 神经网络 命名 实体 识别 方法 | ||
1.一种基于循环神经网络的命名实体识别方法,具体包括如下步骤:
S1、首先对命名实体识别任务数据集中的数据进行整理,统计出数据集中实体的类型,并采用BIO标注策略进行数据预处理,处理后的数据分为两列,第一列为数据集中的字符,第二列为对应的标注标签;
S2、获取当前序列文本的上下文特征:
S21、设置输入门it、遗忘门ft和输出门ot,三种门都是由当前输入xt、上一个隐藏层和上一个细胞状态Ct-1控制的;
S22、首先由xt和输入门it得到新信息Cnew;
S23、新信息再与上一个细胞状态Ct-1融合,得到融合后的新信息,再经过遗忘门ft,得到遗忘后的新信息;
S24、再与前面的新信息Cnew融合得到当前的细胞状态Ct,当前细胞状态再经过输出门控制得到当前隐藏层的输出当前序列文本的特征,此时得到的从前往后的序列文本特征,要想获得文本的上下文特征信息,还需要从后往前计算一遍,将两遍得到的隐藏层相加,得到当前序列文本的上下文特征;
S3、获得前位置字符的标签:该部分将上一步得到的当前序列文本的上下文特征输入到条件随机场模型中,得到当前位置字符的标签概率,从而得到当前位置字符的标签。
2.根据权利要求1所述的一种基于循环神经网络的命名实体识别方法,其特征在于,所述步骤S1中需要对原始数据集进行数据预处理,采用BIO标注策略,BIO标注将每个字标注为“B-X”、“I-X”或“O”,“B-X”表示此元素所在的片段属于X类型并且此元素在此片段的开头,“I-X”表示此元素所在的片段属于X类型并且此元素在此片段的中间位置,“O”表示不属于任何类型。
3.根据权利要求1所述的一种基于循环神经网络的命名实体识别方法,其特征在于,所述步骤S21中需要计算输入门it、遗忘门ft和输出门ot;
S211、门的计算主要依靠函数sigmoid,sigmoid函数将变量控制到0和1之间,为0时表示门完全关闭,为1时表示门完全打开,门的输入由当前输入xt、上一个隐藏层和上一个细胞状态Ct-1控制;
S212、在门中加入细胞状态主要是因为当上一时刻的输出门ot-1关闭时,上一时刻的隐藏层输出为0,则当前时刻的遗忘门、输入门和输出门都只依赖于当前时刻输入xt,这显然不符合长期记忆的要求;
S213、各种门以及新信息的计算公式如下:
其中xt表示当前信息,W表示权重矩阵,b表示偏置,σ表示sigmoid函数,表示上一层的隐藏层信息,it是输入门,是待处理的新信息,表示经过输入门处理后的新信息,ft是遗忘门,Ct表示新信息,ot是输出门。
4.根据权利要求1所述的一种基于循环神经网络的命名实体识别方法,其特征在于,所述步骤S2中得到了当前序列文本的上下文特征,在步骤S3中将得到的上下文特征输入到条件随机场模型中得到当前字符对应的标签概率,根据标签概率的大小得到具体的标签;
条件随机场的参数化定义为:
其中,tk和sl是特征函数,它们是二值函数,函数值为0或者1,满足条件时为1,否则为0,tk是定义在边上的特征函数,依赖于当前和前一个位置,sl是定义在节点上的特征函数,依赖于当前位置。λk和μl是对应的权值,Z(x)是规范化因子,是对所有可能的输出序列上进行求和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111415628.4/1.html,转载请声明来源钻瓜专利网。





