[发明专利]一种人类和恒河猴大脑发育差异系统的分析方法在审
| 申请号: | 202110803706.1 | 申请日: | 2021-07-16 | 
| 公开(公告)号: | CN113470748A | 公开(公告)日: | 2021-10-01 | 
| 发明(设计)人: | 孙少燕;张润 | 申请(专利权)人: | 鲁东大学 | 
| 主分类号: | G16B25/00 | 分类号: | G16B25/00;G16B40/00 | 
| 代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 马国冉 | 
| 地址: | 264001 山东*** | 国省代码: | 山东;37 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 人类 恒河 大脑 发育 差异 系统 分析 方法 | ||
1.一种人类和恒河猴大脑发育差异系统的分析方法,其特征在于,该分析方法包括以下步骤:
S1、基因表达数据处理
选择的样本基因表达数据,并进行分析筛选,得到人类和恒河猴大脑共有的基因表达数据,通过对基因表达数据进行标准化处理,其中表示每一个基因样本表达值,表示该基因的平均表达值,为基因的标准差;
S2、利用主成分的分析方法对基因表达数据进行处理
先将人类和恒河猴大脑的基因表达数据转换为相关系数矩阵,;其中,是和之间的相关系数;
再计算该相关系数矩阵的特征值和特征向量,;
令,,建立主成分分析模型:;
再计算特征值的信息贡献率和累计贡献率,通过计算分析分别筛选出人类和恒河猴的DDGs为1的基因,并分别求人类和恒河猴DDGs为1的基因与基因表达数据的交集,筛掉一部分基因,再对人和猴得到的DDGs取并集;
S3、蛋白质互作网络的选取
选择人类和恒河猴大脑基因对应的蛋白质互作网络,将蛋白质ID转换为基因ID,在蛋白质互作网络中将含有人和猴取并集后得到的基因的边提取出来,得到一个蛋白质互作网络;
进一步的,将恒河猴的基因与小型的蛋白质互作网络里的边对应,提取含有这些基因的边;
将人类的基因与小型的蛋白质互作网络里的边对应,提取含有这些基因的边;
S4、利用基因表达数据结合蛋白质互作网络信息构建无向网络
选取筛选后的基因,求基因之间的斯皮尔曼相关系数的绝对值,若P值小于0.01,则在这两个基因之间设置一条边,令边的长度为令边的长度为,=,功率因数用于增强低相关性和高相关性之间的差异;
S5、利用旅行商问题进行子网络的提取
将最短路径值作为计算旅行商问题的距离,令图为需要求解旅行商问题,从而得到子网所需的图,其中节点,边;
进一步的,建立距离矩阵,使得的值是由Dijkstra算法计算出来的最短路径;
此外,令目标函数为,其中,并使最终路径为闭环路径,使得最终网络图的距离之和最小,从而实现对最短路径网络的处理,将网络中的最短路径数值作为权重,来分析基因之间的相似程度。
2.根据权利要求1所述的一种人类和恒河猴大脑发育差异系统的分析方法,其特征在于,所述S1中基因表达数据的选择是:选择人类大脑从Brain.4wpc到Brain.senior时期的基因表达数据和恒河猴大脑从Brain.e93到Brain.P8030时期的基因表达数据。
3.根据权利要求1所述的一种人类和恒河猴大脑发育差异系统的分析方法,其特征在于,所述样本基因表达数据的筛选步骤为:
A1、找到恒河猴和人类共同拥有的Gene stable ID,将Gene stable ID和其对应的Gene name进行匹配,并找到人类和恒河猴共同拥有的Gene stable ID;
A2、根据找出的共同的Gene stable ID与其Gene name进行对应筛选,分别将人类和恒河猴的共有的基因及其表达数据进行整合,并删掉基因表达数据中的全零行;
A3、由于样本基因表达数据的选择在某些时期不只一个,可能含有多个样本,而且针对同一时期含有多个样本的数据进行取平均值处理,将此平均值作为该时期的基因表达值。
4.根据权利要求1所述的一种人类和恒河猴大脑发育差异系统的分析方法,其特征在于,所述S2中主成分分析方法中:是主成分的数量,i、j表示矩阵的行和列,X和Y代表矩阵坐标方向,n是根据基因的数目进行取值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鲁东大学,未经鲁东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110803706.1/1.html,转载请声明来源钻瓜专利网。





