[发明专利]构建基于PU学习的模型的方法、装置及预测方法、装置在审
| 申请号: | 201910333907.2 | 申请日: | 2019-04-24 |
| 公开(公告)号: | CN110084374A | 公开(公告)日: | 2019-08-02 |
| 发明(设计)人: | 涂威威;王海 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
| 地址: | 100085 北京市海淀区上*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了构建基于PU学习的模型的方法、装置及预测方法、装置,涉及机器学习技术领域,主要目的在于解决解决现有PU学习的模型训练过程中,需要操作人员具备一定的业务经验所导致的模型构建的难度较大、门槛较高的问题。本发明主要的技术方案为:获取样本数据集,所述样本数据集中包括带正标签的正样本数据及无标签的未标记样本数据;基于所述样本数据集训练得到多个候选模型;基于所述样本数据集构造评估集;根据所述评估集,以及预设评估条件分别对每个候选模型进行评估,得到对应每个候选模型的评估结果;选择评估结果符合预设条件的候选模型;根据预设的集成方法对所选择的模型进行集成,得到目标模型。本发明用于对PU学习的模型进行构建。 | ||
| 搜索关键词: | 候选模型 样本数据 构建 评估结果 预设 评估 标签 学习 机器学习技术 模型训练过程 标记样本 模型构建 目标模型 评估条件 业务经验 预设条件 正样本 预测 门槛 | ||
【主权项】:
1.一种构建基于PU学习的模型的方法,包括:获取样本数据集,所述样本数据集中包括带正标签的正样本数据及无标签的未标记样本数据;基于所述样本数据集训练得到多个候选模型;基于所述样本数据集构造评估集;根据所述评估集,以及预设评估条件分别对每个候选模型进行评估,得到对应每个候选模型的评估结果;选择评估结果符合预设条件的候选模型;根据预设的集成方法对所选择的模型进行集成,得到目标模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910333907.2/,转载请声明来源钻瓜专利网。





