[发明专利]一种实体识别方法、装置、计算设备及存储介质在审
| 申请号: | 202310391179.7 | 申请日: | 2023-04-12 |
| 公开(公告)号: | CN116562276A | 公开(公告)日: | 2023-08-08 |
| 发明(设计)人: | 徐丞申;李林;肖明勤;刘荣;黄萧;喻杰 | 申请(专利权)人: | 天津车之家软件有限公司 |
| 主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/289;G06F40/242;G06F16/903 |
| 代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 赵爱军;谢建云 |
| 地址: | 300467 天津市滨海新区生态城动漫中路126号*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实体 识别 方法 装置 计算 设备 存储 介质 | ||
本发明公开了一种实体识别方法、装置、计算设备以及存储介质,实体识别方法在计算设备中执行,该方法包括:获取待识别文本信息;依次确定出待识别文本信息中的待替换的各第一字符串;针对每一第一字符串,确定其对应的第二字符串,并生成该第一字符串和第二字符串之间的映射关系;通过对利用各第二字符串替换对应的第一字符串得到的新的文本信息进行实体识别,得到各实体识别对象;判断各第二字符串是否为实体识别对象;若是,则利用映射关系,确定出该第二字符串对应的第一字符串,作为待识别文本信息的实体识别对象。
技术领域
本发明涉及计算机技术领域,具体涉及一种实体识别方法、装置、计算设备及存储介质。
背景技术
实体识别(Named Entity Recognition,NER)是指识别文本中具有特定意义的实体,其作为信息抽取中的一类典型任务,在问答系统、智能对话、搜索推荐和机器翻译等多项自然语言处理任务中都承担着重要的角色。实体识别可对文本中的时间、地点、数字、人名、组织机构等多类通用性较强的常规实体类型进行识别。
在实体识别的一些场景中,无法对待识别文本信息进行有效识别。例如,在时间实体识别中,“5月1日”可以被识别,而“五一”则无法被识别。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种实体识别方法、装置、计算设备以及存储介质。
根据本发明的一个方面,提供一种实体识别方法,在计算设备中执行,该方法包括:获取待识别文本信息;依次确定出待识别文本信息中的待替换的各第一字符串;针对每一第一字符串,确定其对应的第二字符串,并生成该第一字符串和第二字符串之间的映射关系;通过对利用各第二字符串替换对应的第一字符串得到的新的文本信息进行实体识别,得到各实体识别对象;判断各第二字符串是否为实体识别对象;若是,则利用映射关系,确定出该第二字符串对应的第一字符串,作为待识别文本信息的实体识别对象。
可选地,在根据本发明的实体识别方法中,其中,依次确定出文本信息中的待替换的各第一字符串,包括:判断待识别文本信息中的各字符串是否为预设词典中的字符串;将属于预设词典中的字符串确定为第一字符串。
可选地,在根据本发明的实体识别方法中,其中,生成该第一字符串和第二字符串之间的映射关系,包括:以各第二字符串在新的文本信息中的字段位置和除第二字符串外的各字段的字段位置为键,第一字符串在待识别文本信息中的字段位置和除第一字符串外的各字段的字段位置为值,构建对应键值对,作为第一字符串和第二字符串之间的映射关系。
可选地,在根据本发明的实体识别方法中,其中,还包括:针对每一实体识别对象,判断其与任一第二字符串是否有字段重叠,若是,则确定该实体识别对象在新的文本信息中的开始位置和结束位置;判断各实体识别对象的开始位置和/或更新后的结束位置是否与映射关系中指示相近位置的第二字符串的字段位置一致;若不一致,则减小开始位置的值和/或增加结束位置的值,直到更新后的开始位置和结束位置与映射关系中对应第二字符串的字段位置相同,并将更新后的开始位置和结束位置所对应的字段作为更新后的实体识别对象。
可选地,在根据本发明的实体识别方法中,其中,判断待识别文本信息中的各字符串是否为预设词典中的字符串,包括:对待识别文本信息进行分词处理,并利用分词处理得到的各字符串与预设词典中的字符串进行匹配。
可选地,在根据本发明的实体识别方法中,其中,判断各第二字符串是否为实体识别对象,包括:判断各第二字符串在映射关系中的值是否与目标实体识别对象的开始位置和结束位置一致;若一致,则确定该第二字符串为实体识别对象。
可选地,在根据本发明的实体识别方法中,其中,还包括:保存映射关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津车之家软件有限公司,未经天津车之家软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310391179.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:标靶支架及校准设备
- 下一篇:行业树的建立方法、装置、电子设备及存储介质





