[发明专利]命名实体的识别方法和设备、以及计算机可读存储介质在审

专利信息
申请号: 201910979122.2 申请日: 2019-10-15
公开(公告)号: CN112668333A 公开(公告)日: 2021-04-16
发明(设计)人: 孟函可;祝官文 申请(专利权)人: 华为技术有限公司
主分类号: G06F40/295 分类号: G06F40/295;G06F16/35
代理公司: 北京汇思诚业知识产权代理有限公司 11444 代理人: 冯伟
地址: 518129 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 命名 实体 识别 方法 设备 以及 计算机 可读 存储 介质
【说明书】:

本申请实施例提供了一种命名实体的识别方法和设备,和自然语言处理NLP技术相关,可以应用于人工智能(Artificial Intelligence,AI)领域的语音识别,具体的,可以应用于语音助手等应用。本申请实施例提供的命名实体的识别方法包括:获取待识别文本;确定用于识别所述待识别文本中的命名实体的命名实体识别模型所应用的场景类型;将所述待识别文本和所述场景类型输入所述命名实体识别模型;获取所述命名实体识别模型的输出信息,以确定所述命名实体识别模型针对所述场景类型在所述待识别文本中识别出的命名实体。本申请实施例通过将场景信息嵌入至命名实体模型的输入信息,提高了命名实体识别模型在不同使用场景下识别出命名实体的概率。

技术领域

本申请涉及命名实体识别技术领域,特别涉及命名实体的识别方法和设备、以及计算机可读存储介质。

背景技术

命名实体识别,又名实体识别或NER,是自然语言处理中的一项基础任务,应用范围非常广泛。命名实体一般指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等。NER系统就是从非结构化的输入文本中抽取出上述实体,并且可以按照业务需求识别出更多类别的实体。现有相关技术中的命名实体的识别方法,通常仅针对某种特定的应用场景训练命名实体识别模型,针对不同的场景需要采用大量对应场景下的语料进行训练,分别训练多个识别模型以适用于不同场景,训练过程复杂,模型的适应性不强。

发明内容

本申请提供了一种命名实体的识别方法和设备、以及计算机可读存储介质,以用于使命名实体识别模型能够应用在不同的场景,通过将场景信息嵌入至命名实体模型的输入信息,提高了命名实体识别模型在不同使用场景下识别出命名实体的概率。

第一方面,本申请提供了一种命名实体的识别方法,以用于识别文本中的命名实体。命名实体(Named Entity,或简称实体)指的是文本中具有特定意义或者指代性强的实体,通常包括人名、地名、组织机构名、日期时间、专有名词等,更广泛的实体还包括数字、货币、地址等。

本申请提供的命名实体的识别方法可以应用于正式的识别场景类型中,例如,为语音助手提供文本的命名实体识别。

本申请提供的命名实体的识别方法还可以应用于对命名实体识别模型进行训练的过程中,在应用于训练过程中时,在应用本申请提供的方法识别出训练文本中的命名实体之后,与训练文本中预先标注出的命名实体进行对比,根据对比结果调整命名实体识别模型中的参数。

具体而言,第一方面提供的命名实体的识别方法包括:

获取待识别文本;确定用于识别所述待识别文本中的命名实体的命名实体识别模型所应用的场景类型;将所述待识别文本和所述场景类型输入所述命名实体识别模型;获取所述命名实体识别模型的输出信息,以确定所述命名实体识别模型针对所述场景类型在所述待识别文本中识别出的命名实体。可选的,待识别文本可以是通过语音转换成文本之后得到的文本,也可以是预先标注有命名实体标签的训练样本文本,待识别文本可以包括中文、数字、符号、英文等字符。

命名实体识别(Named Entity Recongition,简称NER)模型(也可以称为命名实体识别系统)可以从上述待识别文本中抽取出上述命名实体,并且可以按照业务需求识别出更多类别的命名实体。命名实体识别模型可以采用现有相关技术中基于特征模板的方法、基于神经网络的方法等实施方式的模型等,在一种可选的示例中,命名实体识别模型可以采用Word Embedding(词嵌入)+LSTM(长短期记忆网络)/BiLSTM(双向长短期记忆网络)+CRF(条件随机场)的模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910979122.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top