[发明专利]构建遗传亚型预测模型的方法、装置和计算机设备在审
申请号: | 201911415078.9 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111145831A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 黄庆生;梁会营;钟嘉泳;高欢;李宽荣 | 申请(专利权)人: | 广州市妇女儿童医疗中心 |
主分类号: | G16B20/40 | 分类号: | G16B20/40;G16B25/10;G16B40/20 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 樊倩 |
地址: | 510000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 构建 遗传 预测 模型 方法 装置 计算机 设备 | ||
本申请涉及一种构建遗传亚型预测模型的方法、装置、计算机设备和存储介质。所述方法包括:接收训练样本的基因表达谱和对应的遗传亚型;按照预先确定的分类个数,对所述基因表达谱进行分类整合,得到目标基因表达谱;所述目标基因表达谱包括与所述分类个数对应的类别;从所述目标基因表达谱的类别中,选取目标类别,构建所述目标类别和所述遗传亚型的对应关系;根据所述对应关系,输出遗传亚型预测模型。采用本方法能够基于在基因表达谱和遗传亚型之间构建的灵活的对应关系,得到遗传亚型预测模型。
技术领域
本申请涉及生物技术领域,特别是涉及一种构建遗传亚型预测模型的方法、装置、计算机设备和存储介质。
背景技术
在传统技术中,可以根据基因表达水平、免疫表型或者荧光原位杂交等特征,确定细胞遗传学异常,进而通过对多个病例进行分析得到上述特征和遗传亚型的对应关系,构建遗传亚型预测模型,但是,这种对应关系仅是简单将病例的上述特征和遗传亚型进行对应,灵活性较差,不能保证从中提取到具有代表性的对应关系,导致遗传亚型预测模型适用范围窄。随着生物技术的发展,对生物体的研究可以深入到基因组和转录组的分子水平。因此,如何在转录组的基因表达谱和遗传亚型之间构建更为灵活的、具有代表性的对应关系是非常必要的。
发明内容
基于此,有必要针对上述技术问题,提供一种能够在基因表达谱和遗传亚型之间构建较为灵活的对应关系的构建遗传亚型预测模型的方法、装置、计算机设备和存储介质。
第一方面,提供一种构建遗传亚型预测模型的方法,包括:
接收训练样本的基因表达谱和对应的遗传亚型;
按照预先确定的分类个数,对所述基因表达谱进行分类整合,得到目标基因表达谱;所述目标基因表达谱包括与所述分类个数对应的类别;
从所述目标基因表达谱的类别中,选取目标类别,构建所述目标类别和所述遗传亚型的对应关系;
根据所述对应关系,输出遗传亚型预测模型。
在一个实施例中,所述从所述目标基因表达谱中的类别中,选取目标类别,构建所述目标类别和所述遗传亚型的对应关系的步骤,包括:
获取所述目标基因表达谱中各个类别的类别值;
将所述类别值中的最大类别值对应的类别,确定为所述目标类别;
构建所述目标类别和所述遗传亚型的对应关系。
在一个实施例中,当所述训练样本包括多个子样本时,所述构建所述目标类别和所述遗传亚型的对应关系的步骤,包括:
根据所述多个子样本的类别值,分别构建子样本的子遗传亚型和子目标类别的子对应关系;各个子对应关系与不同的子样本对应;
从所述各个子对应关系中,选取针对同一种子目标类别的子对应关系;
从所选取的子对应关系的子遗传亚型中,选取出现次数最多的子遗传亚型;
构建所述同一种子目标类别与所选取的子遗传亚型的对应关系。
在一个实施例中,当所述训练样本包括多个子样本时,所述按照预先确定的分类个数,对所述基因表达谱进行分类整合的步骤,包括:
通过非负矩阵分解的方式,按照预先确定的分类个数,对以矩阵形式表示的基因表达谱进行分类整合,得到所述类别的权重矩阵和所述类别的类别值矩阵;所述类别值矩阵为矩阵形式的目标基因表达谱;
所述根据所述对应关系,输出遗传亚型预测模型的步骤,包括:
将所述对应关系映射在所述权重矩阵的行中;
对所述权重矩阵进行奇异值分解处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州市妇女儿童医疗中心,未经广州市妇女儿童医疗中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911415078.9/2.html,转载请声明来源钻瓜专利网。