[发明专利]一种面向MongoDB存储的时态RDF四元组模型及冗余属性消除方法在审

专利信息
申请号: 202310057057.4 申请日: 2023-01-13
公开(公告)号: CN116467278A 公开(公告)日: 2023-07-21
发明(设计)人: 耿道渠;栾剑峰;王平;魏旻 申请(专利权)人: 重庆邮电大学
主分类号: G06F16/21 分类号: G06F16/21;G06F16/28;G06F16/22;G06F16/2458;G06F16/2453;G06F18/22
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 mongodb 存储 时态 rdf 四元组 模型 冗余 属性 消除 方法
【权利要求书】:

1.一种面向MongoDB存储的时态RDF四元组模型及冗余属性消除方法,其特征在于,包括以下步骤:

步骤1、构建时态RDF四元组数据模型,将时态信息作为RDF三元组扩展的新增元组,将三元组扩展为蕴含时态信息的四元组模型,并对扩展后的时态RDF四元组数据模型进行定义;

步骤2、采用面向文档的非关系型MongoDB数据库对时态RDF四元组实例数据进行存储;

步骤3、对存储在MongoDB数据库中文本形式的时态RDF四元组数据使用基于加权的设计算法查找出重复度较高的实例属性,对这些冗余实例属性在已经构建出的本体库中进行消除。

2.根据权利要求1所述的一种面向MongoDB存储的时态RDF四元组模型及冗余属性消除方法,其特征在于,所述步骤1中,时态RDF四元组模型的构建为RDF三元组扩展时态信息的方式构建时态RDF四元组,具体步骤如下:

(1):在多种时态表示方法中选取时态表示方式,确定以时间点和时间间隔作为时间戳来表示时态信息,时间区间即表示对象在该时间区间开始到该时间区间终点为止都是有效的;时间戳,即表示某对象在该时间点上存在有效;

(2):对数据的时态信息进行提取,时态信息可分为三种,有效性时间、事务性时间和用户自定义时间,选取有效性时间,即数据模型中描述历史、现在甚至未来随时间变化的有效性状态信息作为新增元组对三元组进行扩展,以时间戳和数据更新次数作为时态信息构成四元组;

(3):对添加的时态信息的RDF四元组模型进行概念定义,给出样例进行说明,并给出时态RDF图的时间点和时间区间表述形式。

3.根据权利要求2所述的一种面向MongoDB存储的时态RDF四元组模型及冗余属性消除方法,其特征在于,所述步骤1时态RDF资源描述框架四元组模型构建当中的资源描述框架RDF和RDF词汇描述语言RDF Schema是W3C万维网联盟提出的描述Web上信息资源的标准语言,描述了RDF模型的类之间的语义关系,采用唯一确定URI来标识语义Web上的资源,并用属性和属性值来描述资源;RDF的基本结构是由包含节点的边和图进行组成的;两个节点和一条边组成一个三元组,即以主语-谓语-宾语(s,p,o)的陈述形式,也可以表示理解为资源、属性、值的概念关系;通过主语、谓语、宾语的语法形式把属性,属性值和资源联系起来,形成一个完整的资源描述;其中主语描述的是事物的资源,谓语对应的是描述属性标识的资源,宾语是属性的值,为资源或者字面量;当宾语为资源的时候,所表述的是资源与资源之间的关系,如果是字面量则为对资源属性的描述,即为对资源属性以及属性值的声明,并把这种声明称为陈述。

4.根据权利要求3所述的一种面向MongoDB存储的时态RDF四元组模型及冗余属性消除方法,其特征在于,所述时态RDF四元组数据模型的表示语法如下:

时间点表示:(s,p,o,[t]-n),t∈T,n∈N.

时间区间表示:(s,p,o,[ts,te]-n),ts,te∈Tts≤te,n∈N.

在时态RDF四元组模型中(s,p,o)是上述提到的标准RDF三元组主语-谓语-宾语的表述形式;

[t]-n或[ts,te]-n是时态RDF四元组的时态信息部分,且时间信息左右两端均为闭区间。t,ts和te的数据类型为xsd:date,T={[ts,te]|xsd:date}为时域。值得注意的是时间点信息用[t]表示,时间区间信息用[ts,te]表示,当ts=te时,时间区间(s,p,o,[ts,te]-n)等价于时间点(s,p,o,[t]-n),其中t=ts=te;

[t]-n或[ts,te]-n中的n表示更新计数信息,即这个时态RDF四元组更新了n次,n的默认值为1;n的变化是基于事物性时间的变化,即数据在数据库中真实存在的时间,最大的n代表这个时态RDF四元组最新的历史记录,以更新计数n为基础,通过对查询结果集进行排序,可以快速找到四元组的变更记录,并可以在需要时创建事物对数据进行回滚;当1-n中的任意数字m(1≤m≤n)不包含在查询的结果集中,则说明更新次数为m的三元组被删除。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310057057.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top