[发明专利]基于迁移学习的模型建立方法、装置、设备及存储介质有效
| 申请号: | 201910993029.7 | 申请日: | 2019-10-18 |
| 公开(公告)号: | CN110929877B | 公开(公告)日: | 2023-09-15 |
| 发明(设计)人: | 廖希洋 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F18/2431 |
| 代理公司: | 北京市京大律师事务所 11321 | 代理人: | 谢文强 |
| 地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 迁移 学习 模型 建立 方法 装置 设备 存储 介质 | ||
1.一种基于迁移学习的模型建立方法,其特征在于,包括:
获取经过数据预处理的第一研究数据和第二研究数据,将所述第一研究数据和所述第二研究数据合并成目标多中心研究数据,所述第一研究数据包括各中心或各机构对目标疾病患者与非目标疾病患者的检测数据,所述第二研究数据包括各中心或各机构对目标疾病的实验室研究数据,所述检测数据包括的就诊数据和体检数据,所述就诊数据包括个人基本信息和既往病史;
分析所述目标多中心研究数据得到第一数据集和第二数据集,所述第一数据集用于指示标记的目标多中心研究数据,所述第二数据集用于指示未标记的目标多中心研究数据;
通过预置的阈值化双边岭比准则TDRR算法分析所述目标多中心研究数据,获得特征空间维数;
根据所述特征空间维数对所述第一数据集和所述第二数据集进行基于最大均值差异的降维迁移学习,获得降维数据;
通过预置的分类算法和所述降维数据训练初始模型;
调用预置公式计算所述初始模型的检测综合值,并将所述检测综合值达到第一预设阈值的初始模型作为最终的目标模型,所述目标模型用于对所述个人基本信息、所述既往病史和所述体检数据进行处理分析,所述预置公式如下:
,
其中,所述F-score表示为所述检测综合值,所述β表示为特定目标多中心研究数据的场景参数,所述P表示为所述初始模型的准确率,所述R表示为所述初始模型的召回率。
2.根据权利要求1所述的方法,其特征在于,所述通过预置的阈值化双边岭比准则TDRR算法分析所述目标多中心研究数据,获得特征空间维数,包括:
对所述目标多中心研究数据进行特征提取,得到特征信息,所述特征信息包括所述实验室研究数据对应的指标范围与指标属性和所述指标对应的目标多中心研究数据;
通过预置的基于阈值化双边岭比准则TDRR算法,获取所述特征信息的特征空间维数,其中,所述特征空间维数的获取公式如下:
,
,
,
其中,所述Sj为比率,所述λ为所述特征信息,j=1,2,3......p,所述q为所述特征空间维数,所述c1n为脊线,所述c2n为脊线,所述α为阈值,0α1。
3.根据权利要求1所述的方法,其特征在于,所述根据所述特征空间维数对所述第一数据集和所述第二数据集进行基于最大均值差异的降维迁移学习,获得降维数据,包括:
计算所述第一数据集和所述第二数据集的最大均值差异,并根据所述最大均值差异获取核矩阵,其中,所述最大均值差异的计算公式如下:
,
所述核矩阵的计算公式如下:
,,,
其中,所述X1表示所述第一数据集的特征矩阵,所述X2表示所述第二数据集的特征矩阵,所述n1表示所述第一数据集的数据的数量,所述n2表示所述第二数据集的数据的数量,所述x1表示所述第一数据集,所述x2表示所述第二数据集,所述表示特征映射核函数,所述K表示所述核矩阵,所述L表示编码所述第一数据集和所述第二数据集的矩阵;
根据所述核矩阵对所述第一数据集和所述第二数据集进行分析,得到更新后的第一数据集和第二数据集;
通过预置的学习分类器对更新后的第一数据集和第二数据集进行回归处理和预测处理,得到第一预测标签信息;
当检测到所述更新后的第一数据集和第二数据集映射到所述特征空间维数对应的特征空间中时,调用预置的调和函数根据所述第一预测标签信息对所述更新后的第一数据集和第二数据集进行处理,得到降维数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910993029.7/1.html,转载请声明来源钻瓜专利网。





