[发明专利]一种安全的半监督学习方法在审
申请号: | 201310315501.4 | 申请日: | 2013-07-24 |
公开(公告)号: | CN103390171A | 公开(公告)日: | 2013-11-13 |
发明(设计)人: | 周志华;李宇峰 | 申请(专利权)人: | 南京大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210093 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 安全 监督 学习方法 | ||
1. 一种安全的半监督学习方法,其特征在于,包括构建多个半监督分类器步骤和构建最终的安全半监督分类器步骤;
所述构建多个半监督分类器步骤具体为:
步骤100,对于少量有标记数据和大量未标记数据,随机初始化多个半监督分类器;
步骤101,对于每个初始半监督分类器,根据半监督分类器的目标函数,通过优化方法对半监督分类器的预测结果进行优化;
步骤102,将优化过的半监督分类器的预测结果通过机器学习的聚类方法分成多个簇;
步骤103,对于聚类结果的每个簇,输出其中目标值最优的半监督分类器;
步骤104,收集每个簇输出的半监督分类器,得到多个半监督分类器;
所述构建最终的安全半监督分类器步骤具体为:
步骤200,对少量有标记数据训练监督学习方法,得到未标记数据上的预测结果;
步骤201,假定步骤104构建的每个半监督分类器为真实分类器,根据监督学习方法的预测结果,对任意未标记数据上的预测结果定义性能提高函数;
步骤202,对任意未标记数据上的预测结果,对步骤201得到的多个性能提高函数,考察最小的性能提高定义为最坏情况下的性能提高函数;
步骤203,根据最坏情况下的性能提高目标函数,通过优化方法对未标记数据的预测结果进行优化,使其最大化最坏情况下的性能提高目标函数;
步骤204,将优化结果输出,作为最终的安全半监督分类器的预测结果。
2. 如权利要求1所述的安全的半监督学习方法,其特征在于:所述半监督分类器包括基于生成式的半监督分类器、基于图的半监督分类器、基于不一致性的半监督分类器和基于支持向量机的半监督分类器。
3. 如权利要求1所述的安全的半监督学习方法,其特征在于:所述初始化半监督分类器指对未标记数据上的预测结果进行初始化。
4. 如权利要求1所述的安全的半监督学习方法,其特征在于:所述半监督分类器的目标函数包括不同类别数据的间隔和概率似然。
5. 如权利要求1所述的安全的半监督学习方法,其特征在于:所述步骤200中的监督学习方法包括生成式模型方法、最近邻监学习方法和支持向量机学习方法。
6. 如权利要求1所述的安全的半监督学习方法,其特征在于:所述性能提高函数的性能评价指标包括精度、查准率、查全率和F1度量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310315501.4/1.html,转载请声明来源钻瓜专利网。