[发明专利]一种基于多任务学习的命名实体识别方法和装置在审
申请号: | 202010131105.6 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111368545A | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 伯仲璞;王道广;孙靖文 | 申请(专利权)人: | 北京明略软件系统有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 王康;龙洪 |
地址: | 100084 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 学习 命名 实体 识别 方法 装置 | ||
1.一种基于多任务学习的命名实体识别方法,其特征在于,包括:
根据命名实体识别的原任务生成一个主任务以及一个或多个子任务,其中,所述主任务与所述原任务一致,所述子任务为辅助实现所述主任务的任务;
将训练文本输入至命名实体识别网络模型,对所述命名实体识别网络模型进行训练,其中,命名实体识别网络模型至少包括主任务网络和子任务网络,所述子任务网络用于执行所述子任务,并输出子任务预测信息至所述主任务网络,所述主任务网络结合所述子任务预测信息执行所述主任务,输出主任务预测结果;
将待识别文本输入至所述命名实体识别网络模型,根据所述主任务网络的输出确定识别结果。
2.根据权利要求1所述的方法,其特征在于,所述根据命名实体识别的原任务生成一个主任务以及一个或多个子任务,包括:
将主任务设置为与所述原任务一致;
确定所述主任务的抽取目标;
归纳所述抽取目标具有的目标属性;
根据所述目标属性确定所述子任务。
3.根据权利要求1所述的方法,其特征在于,所述命名实体识别网络模型还包括共享网络,
所述共享网络接收输入的文本,进行注意力调整后输出注意力调整矩阵至所述子任务网络和主任务网络。
4.根据权利要求3所述的方法,其特征在于,所述共享网络包括文本嵌入层和多头注意力编码层,其中,
所述文本嵌入层接收输入的文本,将所述文本中的字符转换为字符向量;
所述多头注意力编码层将所述字符向量进行多角度的注意力调整,输出注意力调整矩阵至所述子任务网络和主任务网络。
5.根据权利要求4所述的方法,其特征在于,
所述文本嵌入层通过双向解码器表征模型将所述文本中的字符转换为与上下文相关的字符向量。
6.根据权利要求3~5中任意一项所述的方法,其特征在于,所述子任务网络包括子任务全连接层和子任务条件随机场层,其中
所述子任务全连接层接收所述注意力调整矩阵,按照所述子任务调整注意力,输出子任务注意力调整向量;
所述子任务条件随机场层根据所述子任务注意力调整向量确定每个字符对应的每个标签的概率,得到每个字符对应的概率分布向量,将所述概率分布向量作为子任务预测信息发送至所述主任务网络。
7.根据权利要求6所述的方法,其特征在于,
所述子任务条件随机场层还根据所述概率分布向量确定并输出子任务预测结果。
8.根据权利要求6所述的方法,其特征在于,所述主任务网络包括主任务全连接层、拼接层和主任务条件随机场层,其中
所述主任务全连接层接收所述注意力调整矩阵,按照所述主任务调整注意力,输出主任务注意力调整向量;
所述拼接层获取所述子任务网络发送的概率分布向量,将所述主任务注意力调整向量与概率分布向量进行拼接,输出拼接向量;
所述主任务条件随机场层根据所述拼接向量确定并输出主任务预测结果。
9.一种基于多任务学习的命名实体识别装置,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1~8中任意一项所述的方法。
10.一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1~8中任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010131105.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:阵列基板及显示面板
- 下一篇:图像分割方式的检测方法、装置和显示装置