[发明专利]命名实体识别方法、装置、电子设备及存储介质在审
| 申请号: | 202011159598.0 | 申请日: | 2020-10-26 |
| 公开(公告)号: | CN113761923A | 公开(公告)日: | 2021-12-07 |
| 发明(设计)人: | 金鑫 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30;G06K9/62;G06N3/04 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 孙蕾 |
| 地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 命名 实体 识别 方法 装置 电子设备 存储 介质 | ||
本公开实施例提供了一种命名实体识别方法、装置、电子设备及存储介质。该方法包括:获取待识别文本;对待识别文本进行特征提取,得到目标全局特征向量和目标局部特征向量;将目标全局特征向量和目标局部特征向量进行拼接,得到目标特征向量;以及,利用命名实体识别模型处理目标特征向量,得到用于表征待识别文本的实体类别识别结果。
技术领域
本公开实施例涉及计算机技术领域,更具体地,涉及一种命名实体识别方法、装置、电子设备及存储介质。
背景技术
命名实体识别(Named Entity Recognition,NER)是指识别自然语言文本中具有特定意义的实体,实体主要包括人名、地名、组织名、时间、金钱和日期等。命名实体识别是信息抽取、信息检索和机器翻译等多种自然语言处理(Natural Language Processing,NLP)技术必不可少的组成部分。
在自然语言处理中,由于命名实体识别通常是自然语言理解的第一步,其识别结果会被用于多种后续的NLP任务,因此,命名实体识别的准确率高低至关重要。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:采用相关技术进行命名实体识别的准确率不高。
发明内容
有鉴于此,本公开实施例提供了一种命名实体识别方法、装置、电子设备及存储介质。
本公开实施例的一个方面提供了一种命名实体识别方法,该方法包括:获取待识别文本;对上述待识别文本进行特征提取,得到目标全局特征向量和目标局部特征向量;将上述目标全局特征向量和上述目标局部特征向量进行拼接,得到目标特征向量;以及,利用命名实体识别模型处理上述目标特征向量,得到用于表征上述待识别文本的实体类别识别结果。
本公开实施例的另一个方面提供了一种命名实体识别装置,该装置包括:获取模块,用于获取待识别文本;提取模块,用于对上述待识别文本进行特征提取,得到目标全局特征向量和目标局部特征向量;拼接模块,用于将上述目标全局特征向量和上述目标局部特征向量进行拼接,得到目标特征向量;以及,处理模块,用于利用命名实体识别模型处理上述目标特征向量,得到用于表征上述待识别文本的实体类别识别结果。
本公开实施例的另一个方面提供了一种电子设备,该电子设备包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当上述一个或多个程序被上述一个或多个处理器执行时,使得所述一个或多个处理器实现如上所述的方法。
本公开实施例的另一个方面提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现如上所述的方法。
本公开实施例的另一个方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
根据本公开的实施例,通过获取待识别文本,对待识别文本进行特征提取,得到目标全局特征向量和目标局部特征向量,将目标全局特征向量和目标局部特征向量进行拼接,得到目标特征向量,并利用命名实体识别模型处理目标特征向量,得到用于表征待识别文本的实体类别识别结果。由于目标全局特征向量和目标局部特征向量分别体现了待识别文本在全局和局部两个方面的特征,使得获取到的待识别文本的信息较为全面和丰富,因此,基于命名实体识别模型处理由目标全局特征向量和目标局部特征向量拼接后得到的目标特征向量,所得到的命名实体识别的准确率较高,因而,至少部分地克服了采用相关技术进行命名实体识别的准确率不高的技术问题。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的可以应用命名实体识别方法的示例性系统架构;
图2示意性示出了根据本公开实施例的一种命名实体识别方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011159598.0/2.html,转载请声明来源钻瓜专利网。





