[发明专利]数据空间中异质异构相关数据集合挖掘方法有效

专利信息
申请号: 201410090732.4 申请日: 2014-03-12
公开(公告)号: CN103886049B 公开(公告)日: 2017-02-15
发明(设计)人: 吴扬扬;陈锻生;刘莉 申请(专利权)人: 华侨大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 泉州市文华专利代理有限公司35205 代理人: 陈智海
地址: 362000 福*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 空间 中异质异构 相关 集合 挖掘 方法
【说明书】:

技术领域

发明涉及一种数据空间中异质异构相关数据集合挖掘方法。

背景技术

数据空间是与主体相关的数据及其关系的集合,关联数据查询是数据空间重要的查询技术,而数据空间中的数据可能来自多个不同的数据源,其格式可能多种多样,因此,挖掘数据空间中异质异构相关数据集合是实现关联数据查询的重要基础。

目前对数据空间的研究主要在个人数据空间(PSD),国外主要有Dittrich等人研发的iMeMex[3-5]和Xin Dong等人研发的SEMEX原型系统,国内主要有孟小峰等人研发的OrientSpace的个人数据空间。其中,Dittrich等用一个单一逻辑图模型iDM表示内部的无结构数据,半结构化数据和结构化数据,通过iMeMex的AJAX接口为用户提供导航,查询和搜索功能。提出用pay-as-you-go的信息集成思想,在搜索引擎中加入权重hint来丰富松散的数据源间的关联,定义了iTrails的查询模型和查询策略,iTrails可执行简单的关键词查询和语义查询。Xin Dong等提出了逻辑三元组Triples(object,attribute,value)来表示异构数据和不同对象之间的关联关系,并为数据空间中的异构数据建立一个基于图模型的全局数据视图,以管理多源异构数据;在查询方向,SEMEX不仅考虑了上下文语义信息等数据集成机制,还提出了利用用户反馈来进化数据集成匹配和查询结果。孟小峰等根据用户的习惯来组织数据,提出一种活动静态模型TaskSpace,用于描述活动的组成要素;同时根据在用户数据集合中,只有一部分核心任务的数据项被经常使用,引入了核心数据空间模型CoreSpace(只包括与用户紧密联系的相关任务及所涉及的数据项)。该原型系统主要特点是引入了任务空间和核心空间,提供了基于任务的查询、XML关键词查询及基于串匹配的近似搜索。寇月等提出一种基于语义的数据空间资源搜索策略,将数据资源搜索过程分为:查询预处理,资源对象关联评估和语义关联评估,实现不同级别的语义查询,现有的语义分析,或图像分析等方法只能发现同一类型数据对象的关联,不能发现异质异构数据的关联,所以不能挖掘出异质异相关数据对象集合。

发明内容

本发明要解决的技术问题,在于提供一种数据空间中异质异构相关数据集合挖掘方法,可以发现异质异构数据的关联,挖掘出异质异构相关数据对象集合。

本发明是这样实现的:一种数据空间中异质异构相关数据集合挖掘方法,包括如下步骤:

步骤10、根据用户活动日志文件,分别计算两个活动窗口的相关度,再根据相关度计算出两个活动对象之间的相关值,并将活动对象之间相关值大于第一阈值的活动对象关系保存在活动相关性分析文件中,所述一个活动窗口包括一个活动对象;

步骤20、根据活动相关性分析文件中的对象关系构造数据关联图G;

步骤30、根据数据关联图构造隐对象图GS

步骤40、当隐对象所代表的数据对象集的相关值满足限定的条件时,根据所述隐对象图GS构造一个新的隐对象图Gs';

步骤50、输出新隐对象图Gs'中的隐对象所代表的相关数据对象集合。

进一步地,所述步骤10中相关度包括:活动窗口的标题语义相关度、内容交互相关度、窗口切换相关度及活动时间相关度,所述活动对象关系为两个活动对象及其相关值。

进一步地,所述步骤20进一步具体为:

步骤21、对于结构化和半结构化数据对象,根据其内部结构建立连接相应节点的边,并赋予权重;

步骤22、依次读取活动相关性分析文件中所保存的对象关系,建立连接相应节点的边,并将该对象之间的相关值作为边权重。

进一步地,所述步骤30进一步具体为:

步骤31、创建隐对象:以数据对象为节点,对于数据关联图G的每一个节点vp,在与其相关值大于第二阈值并且不属于其他隐对象的节点中找出相关值最大的节点vq,创建一个隐对象表示{vp,vq};

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410090732.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top