[发明专利]一种识别模型的确定方法和装置有效
申请号: | 201811360817.4 | 申请日: | 2018-11-15 |
公开(公告)号: | CN109685104B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 范芳芳 | 申请(专利权)人: | 同盾控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 模型 确定 方法 装置 | ||
1.一种识别模型的确定方法,其特征在于,所述方法包括:
获取待训练数据和待测试数据,所述待训练数据和所述待测试数据均包括C个类别的数据,所述待训练数据和所述待测试数据来自于多个不同平台的不同数据源;
根据N个学习模型和所述待训练数据,利用Stacking模型融合策略对所述待训练数据和所述待测试数据进行概率预测,以确定特征数据集,所述N个学习模型是基于Lp-Lq混合范数的稀疏线性稀疏多核多任务学习算法框架利用多个多任务学习算法根据所述待训练数据中的第一训练集数据训练得到的包括至少一个多任务学习模型和至少一个单任务学习模型,其中,所述多个多任务学习算法包括L1-Lp-prox算法、Lp-Lq-prox算法、Lp-Lq-altern算法和L1-SepSVM算法;
根据所述特征数据集,对Fisher判别模型进行训练,以确定C-1维的判别函数模型;
通过预设的模型评估指标,确定目标识别模型,所述目标识别模型是符合预设的模型评估条件的所述判别函数模型;
所述N个学习模型包括N-1个多任务学习模型和一个单任务学习模型;所述待训练数据包括第一测试集数据和所述第一训练集数据,C≥2;
所述根据N个学习模型和所述待训练数据,利用Stacking模型融合策略对所述待训练数据和所述待测试数据进行概率预测,以确定特征数据集,包括:
对于N-1个多任务学习模型与一个单任务学习模型,采用k折交叉验证得到N*k个学习模型,通过所述N*k个学习模型对所述第一测试集数据与所述待测试数据进行概率值的预测,将得到的概率值生成对应的特征数据集。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取多个数据平台的数据;
对所述多个数据平台的数据进行预处理;
将预处理后的所述多个数据平台的数据分成所述待训练数据和所述待测试数据。
3.根据权利要求1所述的方法,其特征在于,所述根据N个学习模型和所述待训练数据,利用Stacking模型融合策略对所述待训练数据和所述待测试数据进行概率预测,以确定特征数据集,包括:
根据所述多个多任务学习算法和所述第一训练集数据 ,对所述Lp-Lq混合范数的稀疏线性稀疏多核多任务学习算法框架进行训练,以确定所述N个学习模型;
利用所述Stacking模型融合策略,对所述N个学习模型进行融合训练,以生成N*k个学习模型;
利用所述N*k个学习模型对所述第一测试集数据进行概率预测;
利用所述N* k个学习模型,确定所述待测试数据的概率预测值;
根据所述第一测试集数据对应的概率预测值和所述待测试数据的概率预测值,生成所述特征数据集。
4.根据权利要求3所述的方法,其特征在于,所述根据所述特征数据集,对Fisher判别模型进行训练,以确定C-1维的判别函数模型,包括:
将所述第一测试集数据对应的概率预测值确定为判别数据的训练集;
将所述待测试数据的概率预测值确定为判别数据的测试集;
根据所述判别数据的训练集合所述判别数据的测试集训练所述Fisher判别模型,以确定所述C-1维的判别函数模型。
5.根据权利要求1所述的方法,其特征在于,所述模型评估指标包括召回率、准确率、精准率、F1分数中的至少一者,所述通过预设的模型评估方法,输出符合预设的模型评估条件的目标识别模型,包括:
确定所述判别函数模型的模型评估指标;
当所述判别函数模型的模型评估指标满足所述模型评估条件时,利用TSNE算法对所述判别函数模型进行降维处理,以确定第一预设维数的目标识别模型;
输出所述目标识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同盾控股有限公司,未经同盾控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811360817.4/1.html,转载请声明来源钻瓜专利网。