[发明专利]一种识别模型的确定方法和装置有效
申请号: | 201811360817.4 | 申请日: | 2018-11-15 |
公开(公告)号: | CN109685104B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 范芳芳 | 申请(专利权)人: | 同盾控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 311121 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 模型 确定 方法 装置 | ||
本申请实施例提供了一种识别模型的确定方法和装置,该方法包括:获取待训练数据和待测试数据,该待训练数据和待测试数据均包括C个类别的数据;根据N个学习模型和待训练数据,利用Stacking模型融合策略对待训练数据和待测试数据进行概率预测,以确定特征数据集;根据特征数据集,对Fisher判别模型进行训练,以确定C‑1维的判别函数模型;通过预设的模型评估指标,输出目标识别模型,该目标识别模型是符合预设的模型评估条件的判别函数模型。能够解决人机识别的问题,提升识别模型的识别率以及泛化能力。
技术领域
本申请涉及人机识别技术领域,特别是涉及一种识别模型的确定方法和装置。
背景技术
在互联网领域,随着机器学习技术的发展,为用户提供了各种丰富多彩的体验,但随之带来了网络安全问题,因此产生了人机识别技术,现有技术中,普遍采用传统的机器学习算法进行人机识别,且是二分类识别。目前所采用的人机识别模型都是对不同的平台,例如分别针对各个电商公司训练针对这个平台的一个单分类器,由于每个平台都有自己的特性,且有些平台所产生的数据不全,例如小电商公司由于设备、环境、人员等条件,获取到的数据不完备,这样则会导致一些平台无法训练模型,一些平台所训练出的模型效果差。
发明内容
鉴于上述问题,本申请实施例提供一种识别模型的确定方法,能够解决现有技术在人机识别的存在的数据不全或者模型效果差的问题。
相应的,本申请实施例还提供了一种识别模型的确定装置,用以保证上述方法的实现及应用。
为了解决上述问题,本申请实施例公开了一种识别模型的确定方法,所述方法包括:
获取待训练数据和待测试数据,所述待训练数据和所述待测试数据均包括C个类别的数据;
根据N个学习模型和所述待训练数据,利用Stacking模型融合策略对所述待训练数据和所述待测试数据进行概率预测,以确定特征数据集,所述N个学习模型是基于Lp-Lq混合范数的稀疏线性稀疏多核多任务学习算法框架利用多个多任务学习算法根据所述待训练数据中的第一训练集数据训练得到的包括至少一个多任务学习模型和至少一个单任务学习模型;
根据所述特征数据集,对Fisher判别模型进行训练,以确定C-1维的判别函数模型;
通过预设的模型评估指标,确定目标识别模型,所述目标识别模型是符合预设的模型评估条件的所述判别函数模型。
相应的,本申请实施例还公开了一种识别模型的确定装置,所述装置包括:
数据获取模块,用于获取待训练数据和待测试数据,所述待训练数据和所述待测试数据均包括C个类别的数据;
概率预测模块,用于根据N个学习模型和所述待训练数据,利用Stacking模型融合策略对所述待训练数据和所述待测试数据进行概率预测,以确定特征数据集,所述N个学习模型是基于Lp-Lq混合范数的稀疏线性稀疏多核多任务学习算法框架利用多个多任务学习算法根据所述待训练数据中的第一训练集数据训练得到的包括至少一个多任务学习模型和至少一个单任务学习模型;
模型训练模块,用于根据所述特征数据集,对Fisher判别模型进行训练,以确定C-1维的判别函数模型;
模型输出模块,用于通过预设的模型评估指标,确定目标识别模型,所述目标识别模型是符合预设的模型评估条件的所述判别函数模型。
本申请实施例还提供一种装置,包括处理器以及存储器,其中,
所述处理器执行所述存储器所存放的计算机程序代码,以实现本申请所述的识别模型的确定方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同盾控股有限公司,未经同盾控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811360817.4/2.html,转载请声明来源钻瓜专利网。