[发明专利]一种基于基因大数据的病症关联分析系统及方法有效
| 申请号: | 202210373466.0 | 申请日: | 2022-04-11 |
| 公开(公告)号: | CN114708907B | 公开(公告)日: | 2023-01-31 |
| 发明(设计)人: | 文妍;谢杰;梁丽敏 | 申请(专利权)人: | 广州盛安医学检验有限公司 |
| 主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00 |
| 代理公司: | 广州中研专利代理有限公司 44692 | 代理人: | 刘中航 |
| 地址: | 510000 广东省广州市黄埔区天丰路8号J4栋230*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 基因 数据 病症 关联 分析 系统 方法 | ||
1.一种基于基因大数据的病症关联分析方法,其特征在于,所述方法包括:
获取多个患有目标病症的用户的基因表达数据集;
构建所述基因表达数据集的共表达网络图;所述共表达网络图中的每一节点表示一个基因,每个边的邻接值表示两个基因之间的关联程度;
根据所述共表达网络图确定目标病症的致病SNP组;
将所述目标病症与所述致病SNP组之间的关联关系进行量化,得到所述目标病症的病症关联模型;
构建所述基因表达数据集的共表达网络图,包括:
根据所述基因表达数据集确定每一基因的节点特征矩阵;
每一基因的节点特征矩阵计算每两个基因间的邻接值
其中,vi,n和vj,n为所述基因表达数据集中的任意两个基因的节点特征矩阵,N表示所述基因表达数据集中的用户的数量,和表示该基因在所有用户中的平均特征;
对所述邻接值进行加权,得到每两个基因间的加权邻接值得到每一基因的边矩阵;其中β为预设加权系数。
2.基于权利要求1所述的一种基于基因大数据的病症关联分析方法,其特征在于,根据所述共表达网络图确定目标病症的致病SNP组,包括:
聚合所述共表达网络图上相邻节点的特征提取基因模块组特征;所述基因模块组特征为具有相似基因表达的节点组合;
使用预设致病SNP检测算法检测所述基因模块组特征,得到目标病症的致病SNP组。
3.基于权利要求1所述的一种基于基因大数据的病症关联分析方法,其特征在于,将所述目标病症与所述致病SNP组之间的关联关系进行量化,得到所述目标病症的病症关联模型,包括:
将所述基因表达数据集进行随机重采样,得到多个相同规模的重采样数据集;
针对每一重采样数据集,求解所述致病SNP组的每一种SNP组合时患目标病症的概率,作为目标概率;
将每一重采样数据集求解得到的目标概率进行平均,得到所述目标病症的病症关联模型。
4.基于权利要求3所述的一种基于基因大数据的病症关联分析方法,其特征在于,针对每一重采样数据集,求解所述致病SNP组的每一种SNP组合时患目标病症的概率,作为目标概率,包括:
根据预设决策树算法训练目标预测模型;
将所述致病SNP组的每一种SNP组合作为所述目标预测模型的输入,得到所述目标预测模型的输出为每一种SNP组合时患目标病症的概率,作为目标概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州盛安医学检验有限公司,未经广州盛安医学检验有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210373466.0/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





