[发明专利]一种基于多任务学习的命名实体识别方法和装置在审
申请号: | 202010131105.6 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111368545A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 伯仲璞;王道广;孙靖文 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;龙洪 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 学习 命名 实体 识别 方法 装置 | ||
一种基于多任务学习的命名实体识别方法,包括:根据命名实体识别的原任务生成一个主任务以及一个或多个子任务,其中,所述主任务与所述原任务一致,所述子任务为辅助实现所述主任务的任务;将训练文本输入至命名实体识别网络模型,对所述命名实体识别网络模型进行训练,其中,命名实体识别网络模型至少包括主任务网络和子任务网络,所述子任务网络用于执行所述子任务,并输出子任务预测信息至所述主任务网络,所述主任务网络结合所述子任务预测信息执行所述主任务,输出主任务预测结果;将待识别文本输入至所述命名实体识别网络模型,根据所述主任务网络的输出确定识别结果。
技术领域
本文涉及命名实体识别(Named Entity Recognition,简称NER)技术领域,尤指一种基于多任务学习的命名实体识别方法、装置和计算机可读存储介质。
背景技术
命名实体识别任务是自然语言处理领域的经典任务和热门课题,在自然语言处理技术快速发展的近数十年来一直得到学术界和工业界的广泛关注。
得益于近年来深度学习技术的发展以及深度学习技术与传统基于统计技术的结合,命名实体识别技术已经发展到一个较为成熟的状态。当前命名实体识别技术面对简单任务如公司名识别、人名识别、地明识别等场景,在适当数据量的前提下其准确率、召回率等指标已经可以达到较高的水平,达到工业应用的指标。但当前命名实体识别技术发展仍有不足,如当前模型与方法对复杂命名实体识别任务效果较差。
复杂命名实体识别在命名实体识别的基础上要求模型能够识别出更细粒度的命名实体,识别目标不仅需要目标文本本身特征还需要目标文本上下文特征,此类任务往往难度较大,抽取结果也更具价值。例如,相比识别新闻文本中的所有公司实体,精确识别新闻文本所述事件的事件主体无疑具有更高实用价值。
相关技术虽然提出了一些复杂命名实体识别的方案,但由于处理能力不足,实现效果较差。
发明内容
本申请提供了一种基于多任务学习的命名实体识别方法、装置和计算机可读存储介质,以提升处理复杂命名实体识别任务的能力。
本申请实施例提供了一种基于多任务学习的命名实体识别方法,包括:
根据命名实体识别的原任务生成一个主任务以及一个或多个子任务,其中,所述主任务与所述原任务一致,所述子任务为辅助实现所述主任务的任务;
将训练文本输入至命名实体识别网络模型,对所述命名实体识别网络模型进行训练,其中,命名实体识别网络模型至少包括主任务网络和子任务网络,所述子任务网络用于执行所述子任务,并输出子任务预测信息至所述主任务网络,所述主任务网络结合所述子任务预测信息执行所述主任务,输出主任务预测结果;
将待识别文本输入至所述命名实体识别网络模型,根据所述主任务网络的输出确定识别结果。
在一实施例中,所述根据命名实体识别的原任务生成一个主任务以及一个或多个子任务,包括:
将主任务设置为与所述原任务一致;
确定所述主任务的抽取目标;
归纳所述抽取目标具有的目标属性;
根据所述目标属性确定所述子任务。
在一实施例中,所述命名实体识别网络模型还包括共享网络,
所述共享网络接收输入的文本,进行注意力调整后输出注意力调整矩阵至所述子任务网络和主任务网络。
在一实施例中,所述共享网络包括文本嵌入层和多头注意力编码层,其中,
所述文本嵌入层接收输入的文本,将所述文本中的字符转换为字符向量;
所述多头注意力编码层将所述字符向量进行多角度的注意力调整,输出注意力调整矩阵至所述子任务网络和主任务网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010131105.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:阵列基板及显示面板
- 下一篇:图像分割方式的检测方法、装置和显示装置