[发明专利]一种图数据库中稠密子图挖掘技术框架的应用在审
| 申请号: | 202111219150.8 | 申请日: | 2021-10-20 |
| 公开(公告)号: | CN113985976A | 公开(公告)日: | 2022-01-28 |
| 发明(设计)人: | 郑超;窦凤虎;王心同;张帆 | 申请(专利权)人: | 中电积至(海南)信息技术有限公司 |
| 主分类号: | G06F1/18 | 分类号: | G06F1/18;G06F1/20;G06F11/30 |
| 代理公司: | 重庆百润洪知识产权代理有限公司 50219 | 代理人: | 陈付玉 |
| 地址: | 571924 海南省海口市澄迈县老城*** | 国省代码: | 海南;46 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据库 稠密 挖掘 技术 框架 应用 | ||
本发明提供一种图数据库中稠密子图挖掘技术框架的应用。所述图数据库中稠密子图挖掘技术框架的应用,包括以下步骤:S1:在网页超链接拓扑图分析中,在现有D‑core分解算法的基础上,利用D‑core的分层结构性质逐树,逐层构建一个D‑forest,又分为Top‑down方法和Bottom方法。本发明提供的图数据库中稠密子图挖掘技术框架的应用,充分挖掘了有向图上顶点的拓扑信息以及有向图特有的性质,结合现有的图计算方法,将查询强相关网页集合的时间至少降低一个数量级,同时,本方法提出的指标kmax以及skyline‑area被证实与网页的参与度呈较强的正相关关系。
技术领域
本发明涉及图数据库领域,尤其涉及一种图数据库中稠密子图挖掘技术框架的应用。
背景技术
随着计算机硬件的发展以及数据总量的增加,数据挖掘算法在许多领域都得到了应用,而在这些庞大且复杂的数据如网页超链接拓扑图中,有相当一部分可以以图的形式自然的呈现出来,这些图往往都展现出一种类似社群的基础结构,社群是一种稠密的,由连接紧密的节点构成的子图,D-core作为有向图上社群的一种表现形式,在如在社群搜索,角色识别,垃圾邮件检测等领域中得到了广泛的应用。
D-core是最近的网络研究中提出的一种稠密子图模型,尽管有许多现有的稠密子图模型如k-core,k-truss和k-clique等,代表着稠密的子图,找到它,也就找到了联系紧密的社群,在子图中,每条边都至少在k个三角形中,而即为所有中最大的那一个子图,在子图中,每个顶点至少有k个邻居,而即为所有中最大的那一个子图。
这些模型都只适用于无向图,这些无向图中模型忽略了点与点之间的不对称关系以及边的有向性,如在网页超链接拓扑图中,引用了许多的网页的网页,与被许多其他网页引用的网页显然时不同的,前者类似门户网站,而后者是权威性较高的网站,因此,D-core模型在网页超链接拓扑图的分析中是有必要的, D-core模型同时考虑的每个顶点的传入边以及传出边,并分别赋予他们一个限制,在D-core,也就是(k,l)-core中,子图内每个点都有至少k个传入邻居以及l个传出邻居,并且这个子图是极大的,也就是说它不被包含在另一个拥有同样k,l值的D-core中,这样的网页集合中,网页kmax值代表了此网页的权威度,而lmax值代表了此网页的参与度。
因此,有必要提供一种图数据库中稠密子图挖掘技术框架的应用解决上述技术问题。
发明内容
本发明提供一种图数据库中稠密子图挖掘技术框架的应用,解决了现有技术中k-core,k-truss和k-clique等模型都只适用于无向图,这些无向图中模型忽略了点与点之间的不对称关系以及边的有向性的问题。
为解决上述技术问题,本发明提供的一种图数据库中稠密子图挖掘技术框架的应用,其特征在于,包括以下步骤:S1:在网页超链接拓扑图分析中,在现有D-core分解算法的基础上,利用D-core的分层结构性质逐树,逐层构建一个D-forest,又分为Top-down方法和Bottom方法;
S2:对于一个(k1,l1)-core,它一定被包含在那些k值小于等k1,且l 值小于等于l1的(k,l)-core中,利用这一性质,我们对于每个k值,构造一棵k树,树中的每个节点都是一个网页的集合,其中包括一个或者多个网页,且拥有一个l值,集合中每个网页都至少引用了l个其他网页,集合中的网页是连通的,并且都属于一个(k,l)-core,且不属于(k,l+1)-core,对与相互包含的关系,树中利用父子结构来表示;
S3:根据这样的定义,每个子树都是一个连接的(k,l)-core,因为子树中的网页都至少有根节点l值个传出邻居,并且他们互相连接,而所有k树所组成的森林被称作D-forest;
S4:构造D-forest的方法具体包括Top-down和Bottom-up;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电积至(海南)信息技术有限公司,未经中电积至(海南)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111219150.8/2.html,转载请声明来源钻瓜专利网。





