[发明专利]一种基于PAM聚类算法的基因表达数据分析方法在审
| 申请号: | 202110636220.3 | 申请日: | 2021-06-08 | 
| 公开(公告)号: | CN113380326A | 公开(公告)日: | 2021-09-10 | 
| 发明(设计)人: | 付聪;梁磊;张彦;易星丞;许彤 | 申请(专利权)人: | 吉林省蒲川生物医药有限公司 | 
| 主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B40/00;G06K9/62 | 
| 代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 于晓庆 | 
| 地址: | 130000 吉林省长春市高新区硅谷*** | 国省代码: | 吉林;22 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 pam 算法 基因 表达 数据 分析 方法 | ||
一种基于PAM聚类算法的基因表达数据分析方法,涉及数据分析领域。本发明包括:数据获取、数据预处理、基因模块识别、GO富集分析、PPI网络构建、HUB基因识别和HUB基因验证。本发明在充分利用基因表达数据包含信息的基础上,可以通过多次迭代为每个基因寻找最佳隶属模块,故识别出的基因模块更加可靠。本发明可更好地挖掘出基因模块中包含的隐藏信息,从而对所要解决的生物信息学问题进行全面分析。本发明中通过对基因表达数据进行数据预处理,解决了基因表达数据中存在的噪声多、无关基因多、数据稀疏等问题。本发明通过下游的生物信息学分析流程,可完成一系列生物信息学分析,可以对待解决的生物信息学问题进行全面的分析与解释。
技术领域
本发明涉及数据分析技术领域,具体涉及一种基于PAM聚类算法的基因表达数据分析方法。
背景技术
基因是在生物细胞染色体上具有遗传信息的基本单位,通过基因芯片可以测量出生物体内多个基因的表达情况。基因芯片所利用的是DNA的碱基配对原理,利用人工合成的碱基序列作为基因探针识别细胞中的特定基因,将经过荧光标记等处理后的细胞样本混合到基因芯片上使样本中的核苷酸片段与相应的基因探针杂交。通过荧光成像获得基因芯片上每一个点的荧光强度值,荧光强度值反映了样本中相应基因的表达量。
在一块基因芯片上存储着几千乃至上万个基因,通过基因芯片技术可以同时检测这些基因的表达情况。基因表达数据可以用如下所示的矩阵D表示。矩阵中每一行数据xi.={xi1xi2...xip}表示一个样本中p个基因的表达值,每一列数据x.j={x1jx2j...xnj}表示一个基因在n个不同样本上的表达值,1≤i≤n,1≤j≤p。
基因芯片技术的核心是以基因表达数据为基础进行基因模块的识别。相关研究表明,基因具有模块化发挥功能的特征,具有相同功能的基因其表达量往往相似,即所谓“共表达(Co-expression)”,这为从基因表达数据中识别基因模块提供了依据。所谓基因模块识别即基于基因表达数据的基因聚类,以挖掘具有生物信息学意义的基因集团。
目前,基因模块识别领域中最常用的一种方法是WGCNA算法,该方法首先通过基因表达数据构建基因共表达网络,然后基于该网络的拓扑结构,以层次聚类为基础对基因模块进行识别。虽然该方法已经获得了广泛的应用,但是仍存在一些不足亟待解决:首先,由于WGCNA算法的核心是层次聚类,则该WGCNA算法在执行过程中一旦确定基因属于树状图的哪个分支,就无法撤销,即WGCNA算法无法通过多次迭代为每个基因寻找最佳隶属模块。其次,WGCNA算法在进行模块聚类时仅利用基因表达数据构建基因共表达网络,没有充分利用基因表达数据本身包含的信息。
此外,现有的基因模块识别方法仅以基因聚类为主要工作,而没有对下游的分析进行详细的设计。虽然对于基因模块的准确识别具有重要价值,但是若不与下游的生物信息学分析相结合,则无法充分挖掘出基因模块的生物信息学意义,也无法解决存在的生物信息学问题。
发明内容
为了解决现有基因模块识别方法存在的技术问题,本发明提供一种基于PAM聚类算法的基因表达数据分析方法。本发明以PAM聚类算法为基础,不仅可以识别出可靠的基因模块,还能够利用所识别出的基因模块进行可靠的生物信息学分析。
本发明为解决技术问题所采用的技术方案如下:
本发明的一种基于PAM聚类算法的基因表达数据分析方法,包括以下步骤:
步骤一、数据获取;
步骤二、数据预处理;
步骤三、基因模块识别;
步骤四、GO富集分析;
步骤五、PPI网络构建;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林省蒲川生物医药有限公司,未经吉林省蒲川生物医药有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110636220.3/2.html,转载请声明来源钻瓜专利网。





