[发明专利]实体链接方法、装置、电子设备及计算机可读存储介质在审
申请号: | 201911193824.4 | 申请日: | 2019-11-28 |
公开(公告)号: | CN110941724A | 公开(公告)日: | 2020-03-31 |
发明(设计)人: | 陈伟;董小斐 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F40/295 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 刘蔓莉 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 链接 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本发明涉及一种实体链接方法、装置、电子设备及计算机可读存储介质,所述实体链接方法包括:获取待进行实体链接的实体集合;在第一异质信息网络抽取与所述实体集合匹配的第一实体表达数据,在第二异质信息网络抽取与所述实体集合匹配的第二实体表达数据,所述第一异质信息网络和第二异质信息网络不同;将所述第一实体表达数据和所述第二实体表达数据进行数据融合,得到融合数据;将所述实体集合链接至所述融合数据。本发明实施例能够自动将实体集合链接至该融合数据,使实体集合的实体链接所链接的内容来源于两个异质信息网络,将两个异质信息网络中关于实体集合的实体表达数据进行融合,使得实体链接的信息来源更加全面,使得实体链接更加准确。
技术领域
本发明涉及计算机技术领域,尤其涉及一种实体链接方法、装置、电子设备及计算机可读存储介质。
背景技术
目前,实体链接可以将文本中提及到的实体“苹果”,链接至知识库中相应的实体水果“苹果”、“苹果公司”或是电影《苹果》等;将文本中提及到的实体“非诚勿扰”,链接至知识库中相应的实体综艺节目《非诚勿扰》、或者电影作品《非诚勿扰》等。
然而,目前现有的知识库,可能会存在实体信息不完备的情况,对于实体集合,常常会因知识库缺失信息,造成无法准确链接。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明提供了一种实体链接方法、装置、电子设备及计算机可读存储介质。
第一方面,本发明提供了一种实体链接方法,所述方法包括:
获取待进行实体链接的实体集合;
在第一异质信息网络抽取与所述实体集合匹配的第一实体表达数据,在第二异质信息网络抽取与所述实体集合匹配的第二实体表达数据,所述第一异质信息网络和第二异质信息网络不同;
将所述第一实体表达数据和所述第二实体表达数据进行数据融合,得到融合数据;
将所述实体集合链接至所述融合数据。
可选地,所述方法还包括:
确定在第二异质信息网络中抽取到的第二实体表达数据的数量;
若在第二异质信息网络中抽取到的第二实体表达数据的数量为一个,执行将所述第一实体表达数据与所述第二实体表达数据进行数据融合,得到融合数据的步骤。
可选地,所述方法还包括:
若在第二异质信息网络中抽取到第二实体表达数据的数量为至少两个,基于第一异质信息网络和第二异质信息网络中各实体元素对应的属性信息,计算第一实体表达数据与每个第二实体表达数据之间的属性相似度;
将属性相似度最高的第二实体表达数据确定为待进行数据融合的第二实体表达数据,执行将所述第一实体表达数据与所述第二实体表达数据进行数据融合,得到融合数据的步骤。
可选地,计算第一实体表达数据与每个第二实体表达数据之间的属性相似度,包括:
针对第一实体表达数据与每个第二实体表达数据,分别按照至少一种预设方式分别计算第一实体表达数据与第二实体表达数据之间的相似度,得到至少一个中间相似度;
将至少一个中间相似度的和,确定为第一实体表达数据与每个第二实体表达数据之间的属性相似度。
可选地,所述实体集合包括多个实体元素,将所述第一实体表达数据与所述第二实体表达数据进行数据融合,得到融合数据,包括:
针对所述实体集合中的每个实体元素,在所述第一实体表达数据中抽取与实体元素对应的第一属性信息;
在所述第二实体表达数据中抽取与实体元素对应的第二属性信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911193824.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备
- 下一篇:一种壳状牙齿矫治器佩戴信息的统计方法及统计系统