[发明专利]一种建模方法、建模的装置及存储装置在审
申请号: | 202110090712.7 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112885485A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 张捷 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G16H70/40 | 分类号: | G16H70/40;G16H20/10 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 建模 方法 装置 存储 | ||
本申请公开了一种建模方法、装置及存储装置。其中,该方法包括:接收数据信息,数据信息至少包括细胞系的数据信息和药物的数据信息;对数据信息进行处理,得到药物的敏感性分数;基于细胞系的多个基因表达量,得到相关性矩阵;基于高斯分布随机生成药物向量和细胞系向量,以将药物向量和细胞系向量乘积,得到药物和细胞系的向量矩阵;将药物和细胞系的向量矩阵与相关性矩阵乘积,得到模型;基于模型的参数对模型进行训练,以调整药物向量和细胞系向量,以使模型输出的结果靠近敏感性分数。上述方案,以将药物向量和细胞系向量投影到同一向量空间中,进而利用了细胞系和药物的共享信息特征,提高了模型的准确度和效率。
技术领域
本申请涉及数据处理的技术领域,特别是涉及一种建模方法、建模的装置及存储装置。
背景技术
在癌症的治疗过程,靶向的抗癌药物相对于其他的方法具有更好的杀死癌细胞的效率和更少的毒性。但是鉴于不同的病人不同的基因突变,受试者在使用抗癌药反应和效果也不相同。对于如何在不同的基因突变的癌症患者中使用合适的抗癌药物是精准医疗的巨大方向。目前而言,通过预测病人对某种抗癌药的反应情况,这是一种巨大的挑战。
现有技术基于某一种药物和该药物在不同细胞系的试验数据构建模型,通过该模型预测病人对某种抗癌药的反应情况。由于仅仅针对某一种药物在不同细胞系的试验数据,导致被试验的细胞数目受限制,以使模型具有局限性。
发明内容
本申请提供一种建模方法、建模的装置及存储装置,以解决上述问题。
本申请第一方面提供了一种建模方法,包括:接收数据信息,所述数据信息至少包括细胞系的数据信息和药物的数据信息;对所述数据信息进行处理,得到所述药物的敏感性分数;基于所述细胞系的多个基因表达量,得到相关性矩阵;基于高斯分布随机生成药物向量和细胞系向量,以将所述药物向量和所述细胞系向量乘积,得到药物和细胞系的向量矩阵;将所述药物和细胞系的向量矩阵与所述相关性矩阵乘积,得到模型;基于所述模型的参数对所述模型进行训练,以调整所述药物向量和所述细胞系向量,以使所述模型输出的结果靠近所述敏感性分数。
其中,所述对所述数据信息进行处理,得到所述药物的敏感性分数,包括:对所述数据信息进行筛选;利用拟合贝叶斯函数曲线计算筛选后的数据信息,得到所述药物在每种所述细胞系的IC50值;将所述药物的IC50值乘于第一预设数值,得到所述药物的敏感性分数;以得到模型的目标值。
其中,所述对所述数据信息进行筛选,包括:判断所述数据信息中的整行或整列是否为空;若是,删除所述整行或所述整列;判断所述数据信息中是否具有高毒性的药物数据;若是,则从所述数据信息删除所述具有高毒性的药物数据,以得到所述筛选后的数据信息;通过删除数据为空的整行或整列,减小运算量和提高准确度;通过删除具有高毒性的药物数据,以剔除具有高毒性的药物。
其中,所述基于所述细胞系的多个基因表达量,得到相关性矩阵,包括:对所述细胞系的多个基因表达量取对数,得到第一对数;获取所述细胞系的多个基因表达量的中位数,以对所述中位数取对数,得到第二对数;将所述第一对数减去所述第二对数,得到所述细胞系的第一向量;基于所述第一向量利用皮尔森相关性系数计算,得到所述相关性矩阵;通过上述方式得到相关性矩阵,以得到两种细胞系之间的相关度。
其中,所述基于高斯分布随机生成药物向量和细胞系向量,包括:基于所述高斯分布随机生成从0到1的均匀分布的数列;将所述数列除于第二预设值,得到所述药物向量和所述细胞系向量。
其中,所述基于所述模型的参数对所述模型进行训练,包括:设置有多个预设参数;基于多个所述预设参数依次对所述模型进行训练,得到多个所述模型的结果;选取所述结果与所述敏感性分数最接近的预设参数,作为所述模型的参数;通过选取模型效果最好的预设参数,提高模型的准确度和效率。
其中,所述方法还包括:基于五折交叉验证的方法,评估所述模型的结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110090712.7/2.html,转载请声明来源钻瓜专利网。