[发明专利]一种异构网络中基于元路径的异常模体查询方法有效
| 申请号: | 201910136599.4 | 申请日: | 2019-02-25 |
| 公开(公告)号: | CN109935277B | 公开(公告)日: | 2022-02-15 |
| 发明(设计)人: | 万良田;孙宇宸;于硕;夏锋 | 申请(专利权)人: | 大连理工大学 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00 |
| 代理公司: | 大连理工大学专利中心 21200 | 代理人: | 刘秋彤;温福雪 |
| 地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 网络 基于 路径 异常 查询 方法 | ||
1.一种异构网络中基于元路径的异常模体查询方法,其特征在于,步骤如下:
步骤1)对BIOSNAP项目中的TFG-Ohmnet数据集进行处理并确定查询条件,这个数据集中记录了生物组织,功能以及基因之间的三元关系:
1.1)由于关注的是三元关系中所包含的三个节点的模体之间的相似度,所以直接抽取数据集中的所有三元关系形成网络;
1.2)确定节点查询条件;起始查询条件为三元关系lymphocyte-GO:0050871-100,其中lymphocyte代表生物组织淋巴细胞,GO:0050871为功能编号,而100为基因编号,从该模体出发,查询节点类型为tissue-ontology-gene的异构三点模体,结构为三角形; 根据异构网络的不同节点类型,会产生不同类型的边;元路径被定义为连接两类对象的一条路径,形式化的定义写为:
其中Ai表示节点类型,Ri表示关系类型;
步骤2)根据步骤1.2)中给出的节点查询条件确定候选模体集合和参考模体集合,分为如下两个步骤:
2.1)计算候选模体集合;从起始的三点模体进行广度优先搜索,得到满足元路径要求的点集,使用深度优先搜索找到所有的模体; 对于每种类型的起始点,定义多种元路径进行查询,元路径的起始节点类型应当是起始模体中所包含的任一节点类型,元路径的结束节点类型应当是目标模体包含的节点类型中的一种;由起始模体出发,使用定义的元路径,根据起始模体的节点类型采用对应的元路径进行查询,元路径查询得到的结果是一个满足要求的点集;根据点集中节点类型的不同,从该类型节点在目标模体中所在的不同位置为起点,进行符合条件的模体的查询;对于查询到的模体,当该模体存在同构模体时,由于同一个节点在模体中的位置不同,会使得同一个模体被计算多次,因此需要将重复的模体从结果中去除;最终将产生的所有符合条件的模体存储在一个集合中,即为候选模体集合;
2.2)计算参考模体集合;在步骤1.2)中,在给出候选模体查询条件的同时也会给出参考模体的查询条件,其中,当存在参考模体集合的查询条件时:由初始查询条件按照2.1)的查询步骤,得到候选模体集合和参考模体集合;用户也可以给出一组和候选模体集合格式相同的起始查询条件:由初始查询条件按照2.1)的查询步骤,得到候选模体集合,并令参考模体集合等于候选模体集合,得到参考模体集合;
步骤3)根据步骤2)中得到的候选模体集合和参考模体集合,计算候选模体集合中的每个模体和全体参考模体之间的相似度;
3.1)计算每个模体到参考模体集合的相似度;对于候选模体集合和参考模体集合中的每个模体,计算他们通过查询用的元路径能够到达的节点的集合,以及到达该节点经过的不同路径数目; 由于我们使用的是对称元路径进行路径数量的统计,这里我们在得到两个模体集合经由元路径tissue-gene的可达点以及路径数目后,首先应当确定两个集合的交集则查询的元路径数目为:
其中ma和代表候选模体,mb代表参考模体,Psym表示对称元路径,P表示组成对称元路径的一半路径,Num()函数表示路径的数目,Vab表示模体ma和模体mb中的点经由某条元路径能够走到的节点的集合,以Vab的值作为两点之间的相似度,同时有多条查询元路径的情况下,定义每种路径的不同权重,从而得到加权的相似度值;权值默认为1;
3.2)计算每个模体经由对称元路径返回自身的路径数目,用于对相似度进行正规化;过程中仍需要考虑同类节点和同构因素对计算结果的影响,结果中需要统计每个节点返回自身和同模体中同类型节点的元路径数目作为对相似度进行正规化的标准,即:
通过该公式计算候选模体集合和参考模体集合中每个模体到自身的路径数目,即为与自身的相似度;同样的,当存在多种元路径的情况下,且在3.1)中定义了权值,那么在该步中也要使用相同的权值进行计算;
3.3)使用步骤3.2)得到的每个模体与自身的相似度作为衡量标准对步骤3.1)所得的相似度进行标准化运算;采取不同的正规化相似度进行标准化运算,包括路径相似度PathSim法和余弦相似度法;其中路径相似度PathSim法中定义模体之间的归一化路径相似度为:
其中PathSim表示路径相似度;
由模体间相似度的定义,得到某个模体和参考模体集合之间的相似度定义:
其中mj代表标准模体集合中的任一模体,SR表示参考模体集合,Ω为总的路径相似度;
步骤4)对已经标准化运算后的各个模体,根据正规划相似度进行排序,得到一个从小到大的相似度列表结果集合,其中相似度越低的模体代表与整个候选模体集合差别越大,换句话说即为我们符合要求的模体中的异常部分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910136599.4/1.html,转载请声明来源钻瓜专利网。





