[发明专利]命名实体识别方法及装置在审
申请号: | 202110557992.8 | 申请日: | 2021-05-21 |
公开(公告)号: | CN115455134A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 史舒婷 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F40/295;G06K9/62 |
代理公司: | 北京格罗巴尔知识产权代理事务所(普通合伙) 11406 | 代理人: | 孙德崇 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 命名 实体 识别 方法 装置 | ||
本申请涉及一种命名实体识别方法及装置,所述方法包括:将待识别语句分别与多个问题进行拼接,得到多个拼接语句;针对所述多个问题中的任一问题,基于所述问题对应的拼接语句,确定所述问题的答案信息;基于至少一个第二问题的答案信息,对第一问题的答案信息进行处理,得到第一问题的目标答案,所述第一问题为所述多个问题中的任一问题,所述第二问题为所述多个问题中除所述第一问题以外的任一问题;根据所述多个问题的目标答案,确定所述待识别语句中的命名实体。本申请实施例提供的命名实体识别方法及装置,能够提高识别嵌入实体的准确性。
技术领域
本申请涉及终端人工智能(Artificial Intelligence,AI)领域中的实体识别领域,尤其涉及一种命名实体识别方法及装置。
背景技术
命名实体是指人名、机构名、地名以及其他以名称为标识的实体。命名实体识别作为自然语言处理过程中的重要步骤,被广泛应用到信息抽取、信息检索、信息推荐等任务中。
由于自然语言存在多样性,大量文本中存在着嵌套实体。此处,嵌套实体是指整体上构成一个实体,同时其内部还包含了一个或多个简单实体的情况。举例来说,嵌套实体“张仲景大药房”中包含了人名实体“张仲景”,嵌套实体“南京栖霞区”中包含了地点实体“南京”和地点实体“栖霞区”。嵌套实体识别的结果可以应用于意图分类、槽位提取等多种自然语言理解的问题中。如何对嵌套实体进行准确识别是当前亟待解决的问题。
发明内容
有鉴于此,提出了一种命名实体识别方法及装置,能够提升识别嵌套实体的准确性。
第一方面,本申请的实施例提供了一种命名实体识别方法,所述方法包括:将待识别语句分别与多个问题进行拼接,得到多个拼接语句;针对所述多个问题中的任一问题,基于所述问题对应的拼接语句,确定所述问题的答案信息,所述答案信息用于指示所述待识别语句中所述问题的答案的起始位置和终止位置,以及所述起始位置对应的第一状态概率和所述终止位置对应的第二状态概率;基于至少一个第二问题的答案信息,对第一问题的答案信息进行处理,得到第一问题的目标答案,所述第一问题为所述多个问题中的任一问题,所述第二问题为所述多个问题中除所述第一问题以外的任一问题;根据所述多个问题的目标答案,确定所述待识别语句中的命名实体。
在本申请实施例中,通过拼接多个问题,获得多个答案,可以实现嵌套实体的识别;对任一个问题的答案,通过根据其他问题的答案对该问题的答案进行处理,可以在不确定一个问题的答案是否准确时,以其他问题的答案辅助证明该答案是否准确,提高了该问题的答案的准确性,从而提高了识别嵌套实体的准确性。
根据第一方面,在所述命名实体识别方法的第一种可能的实现方式中,所述基于至少一个第二问题的答案信息,对第一问题的答案信息进行处理,得到第一问题的目标答案,包括:基于所述至少一个第二问题的答案信息,确定至少一个第二答案;基于所述第一问题的答案信息,确定第一答案;在所述至少一个第二答案与所述第一答案满足正向过滤条件的情况下,将所述第一答案确定为所述第一问题的目标答案;或者,在所述至少一个第二答案与所述第一答案满足反向过滤条件的情况下,对所述第一答案进行校验,并在校验通过的情况下,将所述第一答案确定为所述第一问题的目标答案。
在本申请实施例中,通过设置正向过滤条件和反向过滤条件,可以确定第一答案是否可以直接作为第一问题的目标答案,从而提高了目标答案的准确性,提高了识别嵌套实体的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110557992.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虹膜采集装置
- 下一篇:一种GPS拒止条件下的绝对位置感知方法与系统