[发明专利]实体链接方法和装置、存储介质及电子设备在审
| 申请号: | 202210589148.8 | 申请日: | 2022-05-27 |
| 公开(公告)号: | CN115129883A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 杨韬 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/33;G06F40/295;G06F40/30;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 周婷婷 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实体 链接 方法 装置 存储 介质 电子设备 | ||
本发明公开了一种实体链接方法和装置、存储介质及电子设备。其中,该方法包括:获取目标文本,目标文本携带有待链接的目标实体;获取与目标文本对应的第一表征向量,并获取实体数据库中各个对象实体各自对应的第二表征向量;根据第一表征向量与各个第二表征向量进行各自匹配后的结果,从实体数据库的各个对象实体中获取与目标实体相匹配的至少一个候选实体;对目标文本与各个候选实体的实体描述信息分别进行拼接,得到多个候选输入文本;获取与候选输入文本相匹配的链接置信度;根据链接置信度从至少一个候选实体中确定出与目标实体相匹配的链接实体。本发明解决了现有实体链接方法准确率低的技术问题。
技术领域
本发明涉及计算机领域,具体而言,涉及一种实体链接方法和装置、存储介质及电子设备。
背景技术
实体链接是自然语言处理(NPL,Natural Language Processing)里的一项基础技术,其作用是将文本里识别出的命名实体链接到知识库里的正确实体上。
例如,针对一段文本“张三从小就受父亲影响,1988年开始练习网球,1989年的时候,被网球教练夏一相中开始练网球”中的人名“张三”,知识库中存在多个与人名“张三”匹配的词条,如“张三(女子网球名将)”、“张三(青岛籍女演员)”、“张三(流行歌手)”、“张三(画家)”等。上述文本中的人名“张三”应当对应于“女子网球名将”,也就是说,需要通过实体链接技术将人名“张三”与正确的实体“张三(女子网球名将)”进行关联。
现有的实体链接方法通常是对实体进行简单的分析处理,无法确定出实体的准确语义,而基于简单的分析处理方法无法匹配得到准确的实体对象,因此存在实体链接的准确率较低的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种实体链接方法和装置、存储介质及电子设备,以至少解决现有实体链接方法准确率低的技术问题。
根据本发明实施例的一个方面,提供了一种实体链接方法,包括:获取目标文本,上述目标文本携带有待链接的目标实体;获取与上述目标文本对应的第一表征向量,并获取实体数据库中各个对象实体各自对应的第二表征向量,其中,上述第一表征向量用于表征上述目标文本的文本语义,上述第二表征向量用于表征上述对象实体的实体语义,上述对象实体关联有实体描述信息;根据上述第一表征向量与各个上述第二表征向量进行各自匹配后的结果,从上述实体数据库的各个对象实体中获取与上述目标实体相匹配的至少一个候选实体;对上述目标文本与各个上述候选实体的实体描述信息分别进行拼接,得到多个候选输入文本;获取与上述候选输入文本相匹配的链接置信度;根据上述链接置信度从上述至少一个候选实体中确定出与上述目标实体相匹配的链接实体。
根据本发明实施例的另一方面,还提供了一种实体链接装置,包括:第一获取单元,用于获取目标文本,上述目标文本携带有待链接的目标实体;第二获取单元,用于获取与上述目标文本对应的第一表征向量,并获取实体数据库中各个对象实体各自对应的第二表征向量,其中,上述第一表征向量用于表征上述目标文本的文本语义,上述第二表征向量用于表征上述对象实体的实体语义,上述对象实体关联有实体描述信息;第三获取单元,用于根据上述第一表征向量与各个上述第二表征向量进行各自匹配后的结果,从上述实体数据库的各个对象实体中获取与上述目标实体相匹配的至少一个候选实体;拼接单元,用于对上述目标文本与各个上述候选实体的实体描述信息分别进行拼接,得到多个候选输入文本;第四获取单元,用于获取与上述候选输入文本相匹配的链接置信度;确定单元,用于根据上述链接置信度从上述至少一个候选实体中确定出与上述目标实体相匹配的链接实体。
根据本发明实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述实体链接方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210589148.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本显示方法及装置、存储介质及电子装置
- 下一篇:一种数控铣床





