[发明专利]一种匹配图挖掘方法及设备有效
申请号: | 201710109050.7 | 申请日: | 2017-02-27 |
公开(公告)号: | CN108509452B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 谢淼 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F16/50 | 分类号: | G06F16/50 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 匹配 挖掘 方法 设备 | ||
本发明实施例公开了一种匹配图挖掘方法及设备,该方法包括:根据预先获取的离线索引和第一查询图生成交互感知索引,该交互感知索引包含代表所有第一片段的节点且该交互感知索引为一张索引图;若一个片段包含于该第一查询图且该片段为该离线索引中的节点所代表的频繁片段或者判定非频繁片段,则该片段为该第一片段;代表每个片段的节点用于描述该片段的特征;根据预设的多个匹配范式中的一个匹配范式从该交互感知索引中挖掘该第一查询图的匹配图。采用本发明实施例,建立的交互感知索引能够满足不同匹配范式对应的查询图的挖掘要求。
技术领域
本发明涉及计算机技术领域,尤其涉及一种匹配图挖掘方法及设备。
背景技术
随着在线系统数据量的激增,越来越多的关联信息呈现出海量图数据形态,例如,软件剽窃检测中的系统调用关系图、数据流图、生物信息图、蛋白质相互作用(英文:Protein-Protein Interaction,简称:PPI)网络、知识网络、人员合作关系网、专利引用网络及社会网络等。如何对图信息进行精准且快速地挖掘成为近年来急需解决关键问题之一。图(模式)匹配是一种图信息查询方法,已经广泛用于各种图数据库的查询中。一般而言,用户首先需要从实际应用中抽象出一组对图数据中节点关系与属性的约束,这种约束通常表达为一个查询图,其中包含带有标签属性的节点及节点之间的关系。然后利用该查询图,对图数据库中的信息进行查询,图数据库是一个由多个独立的连通图组成的集合,获取图数据库中所有能够子图匹配于查询图的匹配图,即每张匹配图中至少存在一个子图完全“满足”查询图中给定的约束。挖掘匹配图时用到的子图匹配范式用于衡量一个图是否“满足”查询图中给定约束。
对于不同的图匹配范式而言,衡量是否“满足”查询图中给定约束的标准也不同。常见的图模式匹配范式有子图同构匹配、相似子图匹配和泛化子图匹配等。子图同构匹配方法要求所匹配得到的匹配图(也称“结果图”)必须严格满足所有给定的约束,即结果图包括查询图的所有的节点与边的映射关系;相似子图匹配通过一个用户给定的参数Φ来控制约束的程度,允许匹配图中有最多Φ个边或节点与查询图不匹配;子图同构匹配与相似图匹配所需的查询图都为无权图而泛化子图匹配的查询图是有权图,该有权图包含权重信息来指示节点间最大的距离约束,刻画了节点间约束最大所允许的最长路径距离。查询图不同会导致挖掘出的匹配图不同,如果建立一个索引使得该索引中的各个节点代表的图能够满足不同查询图的挖掘要求是本领域的技术人员正在研究的问题。
发明内容
本发明实施例所要解决的技术问题在于,提供一种匹配图挖掘方法及设备,能够满足不同匹配范式对应的查询图的挖掘要求。
下面首先对本发明涉及到的相关概念进行介绍:
【图】本发明关注的图G=(V,E,L)是无向图,其中V为节点集合,为边集合,L是一个标识函数,映射每个节点u∈V与一个标识集合L(u)∈Σ。标识函数L具体为每个节点赋予了具有实际应用意义的一组标识,例如关键词,博客主题,名称,专业,公司等。标识集合Σ为所有这种属性值的全集。定义G(V,E)为上下文简写。假设给定的数据图G为连通图。
【CAM码】给定一个图G,假设Mn×n为G中包含边的邻接矩阵,那么G的CAM码是通过在从顶部到底部,并从最左边到最右侧数值的顺序串联M(包括在对角线上的数值)的下三角区域形成的序列。
【规范标签】给定两个图G和H,(G,H)的规范标签是一个节点映射函数f:VG→VH,使得如果(u,v)∈G.E,那么(f(u),f(v))∈H.E。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710109050.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种通讯录云集及运用方法
- 下一篇:一种信息处理方法及装置