[发明专利]一种肾小球滤过率估算模型的构建方法与系统在审
申请号: | 202210581688.1 | 申请日: | 2022-05-26 |
公开(公告)号: | CN115081190A | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 张军英;尹蚨伊;金剑杰 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06F17/18 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 王晶 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 肾小球 滤过 估算 模型 构建 方法 系统 | ||
一种肾小球滤过率估算模型的构建方法与系统,包括,步骤1:对原始数据集进行mRMR特征选择,筛选出自变量特征,变换后的数据集作为后续建模的基础数据集;步骤2:对基础数据集构建两种线性回归模型;步骤3:对基础数据集进行有放回采样,对重复的样本去重;步骤4:在步骤3去重后的N个采样数据集上对设定的模型训练,获得其参数:得到N个临时的局部模型,分别按步骤2得到的以上两种形式在去重后的N个采样数据集上进行多元线性回归建模;步骤5:全局模型构建,通过步骤4中得到的局部模型参数的平均作为全局模型的参数,得到的全局模型为构建的肾小球滤过率估算模型。本发明针对特定人群数据进行建模,得到更适用于特定人群的GFR估算模型。
技术领域
本发明属于肾小球滤过率估算模型技术领域,具体涉及一种肾小球滤过率估算模型的构建方法与系统。
背景技术
现有技术中,由于直接测定肾小球滤过率(Glomerular Filtration Rate,GFR)的可操作性差,以血清肌酐浓度(SCr)为基础和以血清胱抑素C为基础的GFR公式估算法普遍应用于临床,根据公式估算所得的GFR称为eGFR,成为诊断3~5期CKD的主要依据。这种方法费用低,对患者身体伤害小,但在现有的多种GFR估算公式中,很难确定哪种更好,估算准确度难以保障。
目前存在多种GFR估算公式的原因是,不同人种、年龄、性别、不同种类肾脏疾病人群所适用的GFR估算公式存在区别,不能一概而论。因此,针对特定人群构建专用的GFR估算模型十分必要。
然而可用于模型构建的训练数据十分有限,主要原因是训练数据中需要包含GFR金标准,而由于直接测定GFR的成本高、副作用强等问题,相应技术已在临床淘汰,从而可获得的符合条件的样本极其有限。在机器学习领域这属于小样本问题,并且由于样本数量少,导致训练出的模型可靠性不高,以及甚至无法运用通常的交叉验证技术进行模型性能评价。
发明内容
为了克服上述现有技术存在的不足,本发明的目的在于提供一种肾小球滤过率估算模型的构建方法与系统,针对特定人群,利用小样本数据进行建模,得到针对性更强的GFR估算模型。
为了实现上述目的,本发明采用的技术方案是:
一种肾小球滤过率估算模型的构建方法,包括以下步骤;
步骤1:数据预处理,包括特征选择和log变换,对原始数据集进行mRMR特征选择,筛选出自变量特征,所述自变量特征包括胱抑素C和年龄,自变量特征经过log变换后的数据集作为后续建模的基础数据集;示例地,在本发明中,自变量特征也可仅由胱抑素C和年龄组成,不包含任何其它特征。
步骤2:局部模型设定,针对步骤1得到的基础数据集,构建两种线性回归模型;
步骤3:对数据的超量去重采样,对基础数据集进行有放回采样,对重复的样本进行去重;
步骤4:局部模型的训练,在步骤3去重后的N个采样数据集上对设定的局部模型进行训练,每次训练针对训练集样本按照式(1)计算MSE。
其中n为样本数目,yi为第i个样本的标签真实值,为模型给出的第i个样本的预测值。当MSE不再随训练迭代而减小,结束训练。这样就可得到N个临时的局部模型。分别按步骤2得到的两种线性回归模型在去重后的N个采样数据集上进行多元线性回归建模;得到N个0+1型局部模型和N个0+2型局部模型;
步骤5:全局模型构建,通过步骤4中训练得到的局部模型,取局部模型的参数的平均作为全局模型的参数,得到的全局模型为构建的肾小球滤过率估算模型。
所述步骤1中进行特征选择具体为:
原始数据集中包含22个样本,每个样本包含一个患者的GFR测定值及231个特征,首先对这些候选特征进行mRMR特征选择,筛选出排名前两位的特征:胱抑素C和年龄;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210581688.1/2.html,转载请声明来源钻瓜专利网。