[发明专利]一种数据库的对象描述提供方法、装置及设备有效
| 申请号: | 201811527172.9 | 申请日: | 2018-12-13 | 
| 公开(公告)号: | CN109635004B | 公开(公告)日: | 2023-05-05 | 
| 发明(设计)人: | 许青林;陈烈锋;罗炜平 | 申请(专利权)人: | 广东工业大学 | 
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q40/04 | 
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 | 
| 地址: | 510060 广东省*** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 数据库 对象 描述 提供 方法 装置 设备 | ||
本发明公开了一种数据库的对象描述提供方法,包括:接收各个数据库为对象提供的描述,一个数据库为对象提供的描述的集合为一个值集;全部数据库为对象提供的描述的并集为对象的可能值集;计算所述可能值集中各个描述值的置信度,并按照置信度大小对各个描述值进行排序,从中筛选前N个置信度最高的描述值作为对象的真值,得到目标真值集;N大于1;对目标真值集内的描述进行显示。本发明能够在不同数据源为对象提供的冲突数据中对对象进行多真值发现,适用范围更广,准确性更高;并且,使用户能够查看到一个对象的多个描述结果,用户的体验更好。本发明还公开了一种基于上述方法的装置、设备及计算机可读存储介质。
技术领域
本发明涉及数据库技术领域,特别是涉及一种数据库的对象描述提供方法。本发明还涉及一种数据库的对象描述提供装置、设备及计算机可读存储介质。
背景技术
随着网络技术的飞速发展以及智能设备的广泛使用,数据以前所未有的速度生成和创建。然而,在大数据改变现代社会许多层面的同时,我们也经常可以观察到不同的数据库(或者说数据源)会对同一实体对象提供相互冲突的描述。这些冲突往往是由于输入错误、数据过时、记录丢失等原因造成的,如果应用于实际可能会造成巨大的损害和经济损失。例如,在医疗系统中被用于药物推荐的数据在股票市场上被用于股票价格预测,这显会出现问题。因此,从多个数据源中找到最符合现实的真值(正确的描述)来解决冲突,成为研究热门。
到目前为止,已有大量工作来处理真值发现问题,但是,当前的算法通常假设每个对象只有一个真值,并不适合发现同一个对象有多个真值的情况。然而在现实世界中,对象拥有多个真值的情况可能更为常见。例如,一本书通常有多个作者,一部电影可能有几位导演。因此,目前这种单真值的发现算法,适用范围较窄,且结果准确性较低。
因此,如何提供一种能够发现多真值的数据库的对象描述提供方法是本领域技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种数据库的对象描述提供方法,能够在不同数据源为对象提供的冲突数据中对对象进行多真值发现,适用范围更广,准确性更高;并且,使用户能够查看到一个对象的多个描述结果,用户的体验更好;本发明的另一目的是提供一种基于上述方法的装置、设备及计算机可读存储介质。
为解决上述技术问题,本发明提供了一种数据库的对象描述提供方法,包括:
步骤s1:接收各个数据库为对象提供的描述,一个数据库为所述对象提供的描述的集合为一个值集;全部数据库为所述对象提供的描述的并集为所述对象的可能值集;
步骤s2:计算所述可能值集中各个描述值的置信度,并按照置信度大小对各个描述值进行排序,从中筛选前N个置信度最高的描述值作为对象的真值,得到目标真值集;N大于1;
步骤s3:对所述目标真值集内的描述进行显示。
优选地,所述步骤s2包括:
步骤s21:依据所述对象当前的真值集计算每个数据库的可信度;没有真值集时的初始可信度为特定值;
步骤s22:依据所述可信度依次计算所述对象的可能值集内每个描述的置信度;
步骤s23:将所述置信度从大到小进行排序;
步骤s24:依据所述排序顺序,依次将每个置信度对应的描述添加至真值集内,得到候选真值集,并计算当前得到的候选真值集的目标函数的值;所述目标函数为:
A*为当前的候选真值集,A为数据库s为对象e提供的值集;sim(A*,A)为A*和A之间的余弦相似度;E为全部对象的集合;S(V)是为A*中的描述所属的对象提供值集的全部数据库的集合;t(s)为所述数据库s的可信度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811527172.9/2.html,转载请声明来源钻瓜专利网。





