[发明专利]一种高通量转录组测序数据与性状关联分析系统及方法在审
| 申请号: | 202110081269.7 | 申请日: | 2021-01-21 |
| 公开(公告)号: | CN112837751A | 公开(公告)日: | 2021-05-25 |
| 发明(设计)人: | 康慧敏;李华 | 申请(专利权)人: | 佛山科学技术学院 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00 |
| 代理公司: | 北京八月瓜知识产权代理有限公司 11543 | 代理人: | 李斌 |
| 地址: | 528231 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 通量 转录 序数 性状 关联 分析 系统 方法 | ||
1.一种高通量转录组测序数据与性状关联分析系统,其特征在于,包括:
数据获取模块,用于获取对象的高通量转录组测序数据以及性状表型值;
表达量获取模块,用于根据所述高通量转录组测序数据获取所述对象的每个基因的归一化表达量;
拟合模块,用于通过线性回归模型拟合所述对象的性状表型值与每个所述基因的归一化表达量之间的关系;
求解分析模块,用于求解所述线性回归模型并将所有效应不为零的基因作为与性状关联的基因。
2.如权利要求1所述的一种高通量转录组测序数据与性状关联分析系统,其特征在于,所述线性回归模型的表达式为其中,y为性状表型值向量,μ1为群体均值,Xi是第i个基因的表达量,bi为第i个基因表达量对所述性状表型值的偏回归系数,m为基因数,e为残差。
3.如权利要求2所述的一种高通量转录组测序数据与性状关联分析系统,其特征在于,所述求解分析模块包括算法单元,所述算法单元用于根据弹性网络算法求解所述线性回归模型。
4.如权利要求3所述的一种高通量转录组测序数据与性状关联分析系统,其特征在于,所述弹性网络算法的最小目标函数为其中,λ和α均为调整参数。
5.一种高通量转录组测序数据与性状关联分析方法,其特征在于,包括如下步骤:
获取对象的高通量转录组测序数据以及性状表型值;
根据所述高通量转录组测序数据获取所述对象的每个基因的归一化表达量;
通过线性回归模型拟合所述对象的性状表型值与每个所述基因的归一化表达量之间的关系;
求解所述线性回归模型并将所有效应不为零的基因作为与性状关联的基因。
6.如权利要求5所述的一种高通量转录组测序数据与性状关联分析方法,其特征在于,所述线性回归模型的表达式为其中,y为性状表型值向量,μ1为群体均值,Xi是第i个基因的表达量,bi为第i个基因表达量对所述性状表型值的偏回归系数,m为基因数,e为残差。
7.如权利要求6所述的一种高通量转录组测序数据与性状关联分析方法,其特征在于,根据弹性网络算法求解所述线性回归模型。
8.如权利要求7所述的一种高通量转录组测序数据与性状关联分析方法,其特征在于,所述弹性网络算法的最小目标函数为其中,λ和α均为调整参数。
9.如权利要求8所述的一种高通量转录组测序数据与性状关联分析方法,其特征在于,在拟合所述对象的性状表型值与每个所述基因的归一化表达量之间的关系前,先对所述性状表型值以及每个所述基因的表达量进行标准化处理以使每个所述基因的表达量的均值以及每个所述基因的表达量方差分别为0和1。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现如上述权利要求1至9中任意一项所述的一种高通量转录组测序数据与性状关联分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110081269.7/1.html,转载请声明来源钻瓜专利网。





