[发明专利]一种复杂网络图的概要方法及其在蛋白质关系网中的应用在审
申请号: | 201911335783.8 | 申请日: | 2019-12-23 |
公开(公告)号: | CN110956223A | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 董一鸿;徐丽丽;王雄 | 申请(专利权)人: | 宁波大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 宁波诚源专利事务所有限公司 33102 | 代理人: | 徐雪波;邓青玲 |
地址: | 315211 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 网络图 概要 方法 及其 蛋白质 关系网 中的 应用 | ||
本发明涉及一种复杂网络图的概要方法及其在蛋白质关系网中的应用,将复杂网络图记为G=(V,E),V为节点的集合,E为边的集合,包括:步骤1、在复杂网络图中挑选出子图H=(V′,E′),对于子图中任意两节点组成的边满足条件:sup(e(u,v),H)≥k‑2,将这些子图标记为稠密子图;步骤2、将每个稠密子图中的所有节点压缩成一个节点,将该节点标记为超点,将与所有超点相关联的边,标记为超边;步骤3、将所有超点和除超点外的其他节点组成新的节点集合,将超边和除超边外的其他边组成新的边集合,将新的节点集合和新的边集合形成概要图。能有效减小数据规模,降低网络布局中节点和关联边密集的现象,近似保持原始图的幂率性和聚类系数;且能清晰地显示数据整体结构。
本发明要求以下中国专利申请的优先权,申请日为:2018年12月24日,申请号为:201811583927.7,该申请的全部内容通过引用结合在本申请中。
技术领域
本发明涉及数据处理领域,特别涉及一种复杂网络图的概要方法及其在蛋白质关系网中的应用。
背景技术
现代社会存在大量的复杂网络,如计算机网络、物联网、通信网、交通网络、以及社会关系网络等,对网络进行有效的分析成为重要的科学问题。复杂网络可以用数据结构中的图进行描述,图的节点表示网络中的实体,边表示实体间的联系。随着网络规模的增大,需要占用更多的存储空间。超大规模的复杂网络给算法分析和可视化带来了挑战,复杂网络节点和边关联数量众多,难以从原始网络图中进行有效信息提取并分析;其结构的复杂且出现噪声边影响原始图的可视化,人们无法准确观察到网络的拓扑结构。
大规模图数据中隐藏了大量有用的信息,需要进行有效的提取。近年来科研人员开始研究如何将大规模图的节点聚集成若干组,构造一个能反映原始图结构和图属性的小规模图,称为概要图,概要图在复杂网络的存储分析和可视化中扮演重要角色。采用图概要技术将大规模的图转化为相对较小的图,保持原始图的结构和性质。一般将结构或者属性值相近的节点进行概要化生成概要图,代替原始图来进行相应图分析算法,有效压缩图数据的规模、减少存储空间压力、减少图数据中冗余噪声边的影响和增强可视化的展示效果,在一定程度上解决了复杂网络所面对的问题。但目前概要算法在度量相似结构中大多从网络网络结构考虑,例如:基于团或者基于度的性质考虑,没有考虑到对复杂网络的小世界特性和无标度特性的研究。复杂网络是呈现高度复杂性的网络,复杂网络的小世界特性与网络的平均聚类系数有关,无标度特性与网络的幂率性有关。因此,针对大规模的复杂网络,构建保持复杂网络图特性的概要图并进行进一步分析逐渐成为近几年的研究热点。
蛋白质是一种复杂的有机化合物,也称“多肽”,它由氨基酸分子排列的线性链所构成,其氨基酸序列是由对应的基因序列所确定。多个蛋白质可以组成复合体来实现某一特定功能。蛋白质及其复合物的功能有很多,最主要的几种基本生物功能由:组成和修复成物体、调节生物体的生理机能,运输载体和供给能量。近年来,越来越多的生物学研究者开始研究蛋白质组学,蛋白质组学是应用各种技术研究蛋白质组的一门新兴科学,其目的时从整体的角度分析细胞内动态变化的蛋白质组分、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律。然而细胞中的每一个蛋白质都不是孤立存在的,每一项生命活动从开始到结束都会涉及到多个蛋白质,这些蛋白质通过相互作用连在一起共同完成一项生命活动。因此,在蛋白质组学中,大多学着采用蛋白质相互作用网络(ProteinProtein Interaction Networks)来研究纷繁复杂的蛋白质相互作用关系。蛋白质相互作用网络,也称蛋白质关系网,可以描述呈一个以蛋白质为节点,蛋白质相互作用关系为边构成的网络。蛋白质相互作用关系网络刻画了一个生物体内所有蛋白质之间的全局关系,因此蛋白质相互作用关系网络研究是生物学和计算机科学领域的一个研究重点。并且在细胞生物活动中,绝大多数蛋白质都是通过与其他蛋白质的相互作用形成蛋白质复合物来共同完成一个指定的功能。但是在某一个蛋白质相互作用网络中,需要分析的蛋白质结构分厂数量庞大,直接分析所有的蛋白质个体会导致复杂度过高,且至多只能考虑蛋白质对间的相互作用,无法得知蛋白质复合物的具体作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911335783.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电暖器
- 下一篇:一种用于板材加工专用的数控机床