[发明专利]基于小样本的疾病亚型预测方法、系统、装置及介质在审
| 申请号: | 202010843441.3 | 申请日: | 2020-08-20 |
| 公开(公告)号: | CN112116957A | 公开(公告)日: | 2020-12-22 |
| 发明(设计)人: | 梁勇;杨子翊 | 申请(专利权)人: | 澳门科技大学 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B25/10;G16B5/00;G06K9/62 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 邓建辉 |
| 地址: | 中国澳门氹*** | 国省代码: | 澳门;82 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 样本 疾病 预测 方法 系统 装置 介质 | ||
1.基于小样本的疾病亚型预测方法,其特征在于,包括以下步骤:
获取第一数据集的基因表达数据;
通过预测模型对所述基因表达数据进行预测,得到所述第一数据集的疾病亚型;所述预测模型包括样本选择网、特征选择层以及元学习器;
所述预测模型通过以下步骤训练得到:
构建第一样本数据集;所述样本数据集包括第二数据集的基因表达数据;
通过所述特征选择层得到所述训练数据集的特征加权向量;根据所述特征加权向量构建第二样本数据集;
将所述第二样本数据集输入所述样本选择网得到样本权重;
根据所述第二样本数据集以及所述样本权重,训练所述元学习器,得到训练完成的预测模型。
2.根据权利要求1所述的基于小样本的疾病亚型预测方法,其特征在于,所述构建第一样本数据集这一步骤,其具体包括:
获取若干所述基因表达数据,通过元分析得到所述第一样本数据集;
或获取若干所述基因表达数据,通过批次校正以及机器学习,整合得到所述第一样本数据集。
3.根据权利要求1所述的基于小样本的疾病亚型预测方法,其特征在于,所述构建第一样本数据集这一步骤中,其还包括:
从所述第二数据集中,根据所述基因表达数据的类别抽取得到若干支持样本和若干查询样本;
根据所述支持样本构建支持集;根据所述查询样本构建查询集。
4.根据权利要求1所述的基于小样本的疾病亚型预测方法,其特征在于,所述将所述第二样本数据集输入所述样本选择网得到样本权重这一步骤,其具体为:
确定所述第二样本数据集中的样本数据的置信度,根据所述置信度分配所述样本权重。
5.根据权利要求4所述的基于小样本的疾病亚型预测方法,其特征在于,所述确定所述第二样本数据集中的样本数据的置信度这一步骤,其还包括:
确定所述第二样本数据集中的样本数据的损失函数,将所述损失函数嵌入所述样本数据,通过神经网络拟合加权函数,得到所述样本数据的置信度。
6.根据权利要求3所述的基于小样本的疾病亚型预测方法,其特征在于,所述根据所述第二样本数据集以及所述样本权重,训练所述元学习器,得到训练完成的预测模型这一步骤,其中,训练所述元学习器这一步骤包括:
根据所述样本权重去除所述支持集中的噪声样本;确定去噪后支持集中的样本类别;
得到去噪后的支持集中样本与所述样本类别的欧几里距离,对所述欧几里得距离进行归一化,得到所述元学习器的输出。
7.根据权利要求6所述的基于小样本的疾病亚型预测方法,其特征在于,根据所述第二样本数据集以及所述样本权重,训练所述元学习器,得到训练完成的预测模型这一步骤,其还包括:
根据所述查询集,对所述元学习器的输出进行校验,根据检验结果输出训练完成的预测模型。
8.基于小样本的疾病亚型预测的系统,其特征在于,包括数据获取单元、模型构建单元,预测输出单元,其中:
所述数据获取单元,用于获取第一数据集的基因表达数据;
所述模型构建单元,用于训练得到预测模型,所述预测模型包括:样本选择网、特征选择层以及元学习器;所述预测模型的训练步骤包括:
构建第一样本数据集;所述样本数据集包括第二数据集的基因表达数据;通过所述特征选择层得到所述训练数据集的特征加权向量;根据所述特征加权向量构建第二样本数据集;将所述第二样本数据集输入所述样本选择网得到样本权重;根据所述第二样本数据集以及所述样本权重,训练所述元学习器,得到训练完成的预测模型;
所述预测输出单元,用于通过预测模型对所述基因表达数据进行预测,得到所述第一数据集样本的疾病亚型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于澳门科技大学,未经澳门科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010843441.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:机器学习稀疏计算机制
- 下一篇:一种结合应力仿真的整机加速贮存试验设计方法





