[发明专利]基于小样本的多组学数据中基因型与表型关联分析方法有效

专利信息
申请号: 202110288323.5 申请日: 2021-03-17
公开(公告)号: CN113192556B 公开(公告)日: 2022-04-26
发明(设计)人: 郭新鹏;宋亚飞;刘帅忱;刘树慧;王艺菲;尚学群 申请(专利权)人: 西北工业大学;中国人民解放军空军工程大学
主分类号: G16B20/20 分类号: G16B20/20;G16B40/30;G16B40/20;G16B50/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 710072 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 样本 多组学 数据 基因型 表型 关联 分析 方法
【权利要求书】:

1.基于小样本的多组学数据中基因型与表型关联分析方法,其特征在于,具体包括下列步骤:

第一步,利用蛋白质网络和基因表达值生成带权无向基因关联图,并利用SPICi聚类方法对该带权无向基因关联图进行聚类,生成基因簇;

利用蛋白质网络数据及基因表达数据生成带有权重的基因网络图;采用SPICi聚类方法对生成的基因网络图进行聚类;SPICi方法有三个超参,分别为最小聚类数值minimumcluster size、最小支持阈值minimum support threshold、最小聚类密度minimumcluster density;三个参数共同影响着聚类的个数及每个聚类元素个数;对三个超参的设定再作进一步分析;

最小聚类数值(minimum cluster size)的作用是通过与各聚类中所包含基因个数比较来决定该聚类的去留,即聚类中元素个数大于最小聚类数值则保留该聚类,否则舍弃该聚类;若将最小聚类数值设定过小,则达不到捕捉基因间关联关系的目的,但过大又会误删聚类簇;根据对不同数据测试,最终将最小聚类数值设定为[4,6]这样的区间范围;在基因网络图G=(V,E)中,V代表基因网络图G中所有顶点集合,E代表基因网络图G中所有边的集合;对于任意顶点u和与u相连的顶点集合定义support:

support(u,S)指与顶点u相连的所有边权重之和,wu,v代表顶点u与顶点v之间边的权重;用两个顶点向量的皮尔森相关系数代表边的权重,对所求解的皮尔森相关系数取绝对值,由此wu,v∈(0,1],将最小支持阈值定为[0.4,0.7]的区间范围;聚类密度density(S)的定义为边权值的总和除以可能的边个数的总数,来反映子图的紧密程度;公式如下:

将最小聚类密度参数取值范围设定为[0.1,0.6];

第二步,利用group Lasso方法对基因簇进行筛选;

由于基因本身基数大,由第一步所得基因簇数量相对较多,利用分组最小角回归算法对基因簇和表型做回归运算;若基因簇为L组,则由Lasso回归中对每个特征的选择推广为分组最小角回归算法中对每组特征的选择,其目标函数如下:

其中λ为正则化参数,控制整体惩罚的力度,X,Y分别为自变量和因变量矩阵,β为系数向量,而βl为每组系数向量,是每一组的加权,按需调节;如果βl=0,则对应该基因簇被剔除,反之,若βl≠0,则对应该基因簇保留,此操作达到基因簇筛选的目的;

第三步,通过eQTL数据得到筛选后的基因簇所对应的SNP簇;

通过第二步筛选出系数不为零的基因簇,而这些基因簇则被认为最有可能对表型产生影响;这些基因簇导致疾病的主要原因是簇中基因上的差异位点影响产生,故需再建立SNP与基因间的关联关系,这样便能够完整的反映基因型与表型通路关系;GTEx数据中的数量性状基因表达位点eQTL是反映各个组织中的SNP与基因间关联关系,在eQTL数据中查找与每个簇中基因关联的SNP信息,这样便得到基因簇所对应的SNP簇;

第四步,将每个SNP簇、所对应的基因簇及表型构建为一个三层网络类块,对每个类块中SNP与基因关联关系采用稀疏偏最小二乘方法进行回归运算,对基因与表型关联关系采用逻辑回归进行运算;

将对应的SNP簇、基因簇及表型组合为一个三层网络,将其称之为类块block,每个类块构建一个三层网络;在处理各类块SNP与基因关联关系时,同时考虑层内及层间关联关系;解决SNP与基因关联关系问题的方法是用稀疏偏最小二乘方法SPLS;解决基因与表型关联关系则采用逻辑回归的方法完成;

第五步,对各类块所得预测结果求平均,得到最终预测结果;

通过第四步构建多个类块进行预测分析,各类块间并不存在强依赖关系,能够同时进行并行化运算,对各类块所得预测结果求平均,得到最终预测结果。

2.如权利要求1所述的基于小样本的多组学数据中基因型与表型关联分析方法,其特征在于,在第一步的实验的过程中,以0.1的递增度对最小聚类密度参数进行参数测试。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学;中国人民解放军空军工程大学,未经西北工业大学;中国人民解放军空军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110288323.5/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top