[发明专利]基于多视图学习的欺诈标记的方法和装置在审
| 申请号: | 201910581229.1 | 申请日: | 2019-06-29 |
| 公开(公告)号: | CN110363415A | 公开(公告)日: | 2019-10-22 |
| 发明(设计)人: | 孙涛;陈雪清;熊俊 | 申请(专利权)人: | 上海淇馥信息技术有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/00;G06K9/62 |
| 代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
| 地址: | 201500 上海市崇明区横沙乡富民*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标记数据 分类器 次级分类器 方法和装置 用户数据 欺诈 学习 停止条件 样本数据 低成本 预设 协同 融合 | ||
本发明公开基于多视图学习的欺诈标记的方法和装置,方法包括,获取用户数据集;将用户数据集分为已标记数据集和未标记数据集;在已标记数据集上,基于不同视图分别训练多个视图分类器;使用训练后的多个视图分类器对未标记数据集中的部分数据进行判断标记;将标记后的数据加入已标记数据集,形成新的已标记数据集;循环进行上述新的已标记数据集动作,直至达到预设的停止条件;融合多个视图分类器,生成次级分类器;使用次级分类器对数据进行判断标记。本发明利用数据在不同的视图学习的难易程度不同,来发挥视图之间的相互作用,优势互补,协同学习,达到了采用较少较低成本的样本数据进行欺诈标记的效果。
技术领域
本发明涉及信息处理领域,尤其涉及一种基于多视图学习的欺诈标记的方法和装置。
背景技术
随着互联网消费金融的蓬勃发展,人们越来越多的使用线上平台进行业务申请,快捷的操作和简单的流程,使得移动手机作为主要的申请工具成为用户与平台、用户与用户之间的重要媒介。欺诈风险是互联网金融行业面临的主要风险之一,是信贷风险管理的重要环节。
在反欺诈领域,一个现实的问题是由于获取成本高昂,欺诈标签往往十分有限。在样本不足的情况下,常规的预测模型受到极大限制。亟需一种能够减少对样品数量的依赖,但又能准确标记欺诈风险的方法。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
鉴于上述问题,提出了本发明说明书以便提供一种克服上述问题或者至少部分地解决上述问题的基于多视图学习的欺诈标记的方法和装置。
本发明说明书公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
第一方面,本发明公开了基于多视图学习的欺诈标记的方法,包括,
获取用户数据集;
将用户数据集分为已标记数据集和未标记数据集;
在已标记数据集上,基于不同视图分别训练多个视图分类器;
使用训练后的多个视图分类器对未标记数据集中的部分数据进行判断标记;
将标记后的数据加入已标记数据集,形成新的已标记数据集;
循环进行上述新的已标记数据集上,基于不同视图训练多个视图分类器以及使用训练后的多个视图分类器对未标记数据集中的部分数据进行判断标记的动作,直至达到预设的停止条件;
融合多个视图分类器,生成次级分类器;
使用次级分类器对数据进行判断标记。
在本公开的一种示例性实施例中,所述基于不同视图分别训练多个视图分类器包括,
基于来自不同视图的独立相容的特征训练多个视图分类器。
在本公开的一种示例性实施例中,所述基于来自不同视图的独立相容的特征训练多个视图分类中,所述独立相容的特征为视图的特征映射的输出空间一致性,且视图的特征之间具有独立性。
在本公开的一种示例性实施例中,所述将标记后的数据加入已标记数据集,形成新的已标记数据集,包括,
从标记后的数据中挑选多个预测置信度较高的数据加入已标记数据集,形成新的已标记数据集。
在本公开的一种示例性实施例中,所述预测置信度较高的数据包括预测最有把握的正样本和负样本。
在本公开的一种示例性实施例中,所述正样本和负样本的判断标准为,
设定阈值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇馥信息技术有限公司,未经上海淇馥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910581229.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:配送区域的划分方法及装置
- 下一篇:金融资源分配方法、装置及电子设备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





