[发明专利]基于迁移学习的模型建立方法、装置、设备及存储介质有效
| 申请号: | 201910993029.7 | 申请日: | 2019-10-18 |
| 公开(公告)号: | CN110929877B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 廖希洋 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F18/2431 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谢文强 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 迁移 学习 模型 建立 方法 装置 设备 存储 介质 | ||
本申请涉及人工智能领域,提供一种基于迁移学习的模型建立方法、装置、设备及存储介质,方法包括:将第一研究数据和第二研究数据合并成目标多中心研究数据;分析所述目标多中心研究数据得到第一数据集和第二数据集;通过预置的阈值化双边岭比准则TDRR算法分析所述目标多中心研究数据,获得特征空间维数;根据所述特征空间维数对所述第一数据集和所述第二数据集进行基于最大均值差的降维迁移学习,获得降维数据;通过预置的分类算法和所述降维数据训练初始模型,获得目标模型。采用本方案,能够提高经过模型处理后的数据可靠性。
技术领域
本申请涉及智能决策领域,尤其涉及基于迁移学习的模型建立的方法、装置、设备及存储介质。
背景技术
目前的智能决策中,通过获取训练数据,将训练数据输入到模型中,对模型进行训练,获得数据分析模型,通过数据分析模型对目标数据进行分析与处理,得到数据分析结果。
由于训练的数据分析模型用于不同地区、不同的机构和不同的研究中心,输入数据分析模型的数据与实际检测数据存在差异,这种数据差异又往往被默认为误差或者是检测数据超出指标范围,而这种数据差异大部分是由不同地区、不同机构或者中心间的检测仪器存在较大差异和对于指标合理范围的不同定义所造成的,因而,导致经过模型处理后的数据可靠性低。
发明内容
本申请提供了一种基于迁移学习的模型建立方法、装置、设备及存储介质,用于对数据进行降维处理和迁移学习,并根据经过降维处理和迁移学习的数据对初始模型进行训练得到目标模型,提高了经过模型处理后的数据可靠性。
第一方面,本申请提供一种基于迁移学习的模型建立方法,所述方法包括:
获取经过数据预处理的第一研究数据和第二研究数据,将所述第一研究数据和所述第二研究数据合并成目标多中心研究数据,其中,所述第一研究数据包括各中心或各机构的检测数据,所述第二研究数据包括各中心或各机构的实验室研究数据;
分析所述目标多中心研究数据得到第一数据集和第二数据集,所述第一数据集用于指示标记的目标多中心研究数据,所述第二数据集用于指示未标记的目标多中心研究数据;
通过预置的阈值化双边岭比准则TDRR算法分析所述目标多中心研究数据,获得特征空间维数;
根据所述特征空间维数对所述第一数据集和所述第二数据集进行基于最大均值差异的降维迁移学习,获得降维数据;
通过预置的分类算法和所述降维数据训练初始模型;
调用预置公式计算所述初始模型的检测综合值,并将所述检测综合值达到第一预设阈值的初始模型作为最终的目标模型,所述预置公式如下:
,
其中,所述F-score表示为所述检测综合值,所述β表示为特定目标多中心研究数据的场景参数,所述P表示为所述初始模型的准确率,所述R表示为所述初始模型的召回率。
一种可能的设计中,所述通过预置的阈值化双边岭比准则TDRR算法分析所述目标多中心研究数据,获得特征空间维数,包括:
对所述目标多中心研究数据进行特征提取,得到特征信息,所述特征信息包括所述实验室研究数据对应的指标范围与指标属性和所述指标对应的目标多中心研究数据;
通过预置的基于阈值化双边岭比准则TDRR算法,获取所述特征信息的特征空间维数,其中,所述特征空间维数的获取公式如下:
,,
,
其中,所述Sj为比率,所述λ为所述特征空间维数,j=1,2,3......p,所述q为所述维数,所述c1n为脊线,所述c2n为脊线,α为阈值,0α1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910993029.7/2.html,转载请声明来源钻瓜专利网。





