[发明专利]一种识别风险对象的方法、装置及设备有效
| 申请号: | 201910003877.9 | 申请日: | 2019-01-03 |
| 公开(公告)号: | CN109787970B | 公开(公告)日: | 2020-11-17 |
| 发明(设计)人: | 李厚意;叶小萌;曹绍升 | 申请(专利权)人: | 创新先进技术有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L12/24;G06K9/62 |
| 代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 杨移 |
| 地址: | 开曼群岛大开曼岛乔治镇医院*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 识别 风险 对象 方法 装置 设备 | ||
本说明书公开了一种识别风险对象的方法、装置及设备。该方法包括:获取多个待识别对象,所述待识别对象至少包括事件和/或所述事件对应的介质信息;根据所述事件和/或所述事件对应的介质信息,创建构图,得到至少一种构图;根据在训练分类器过程中对构图上某一时间点前的事件和/或介质信息进行打标的标签信息及构图上边的权重,确定构图上的每个事件和/或介质信息的特征;根据构图上的事件和/或介质信息的特征,利用训练好的分类器对某一时间点后的事件和/或介质信息进行分类,得到待识别对象中的风险对象。
技术领域
本说明书涉及计算机技术领域,尤其是涉及一种识别风险对象的方法、装置及设备。
背景技术
互联网技术的蓬勃发展给人们带来了便捷的生活。与此同时,也给人们的生活带来了诸多的弊端。例如,目前网络上出现了盗卡、盗号、欺诈和垃圾小号注册等风险行为。
传统的风控系统通常将识别上述风险行为的问题转化为二分类问题(通过机器学习解决二分类问题)或者直接用专家系统。然而,专家系统对一些阈值的把握存在主观臆断,会扭曲客观事实,导致识别出的风险对象准确率低。而机器学习可以学习到训练样本每一个特征的阈值和权重。但在机器学习当中有标签的待预测样本(目标对象)是比较少的,随着特征越来越多,在有监督学习系统之中很容易出现过拟合的情况。例如,只有1000个黑样本,但是有10万个特征。该通过机器学习识别风险对象的方法鲁棒性较差。此外,另一种在风控场景下最常用的半监督方法是标签传播方法。但这种方法会强依赖于构图,即构图时以什么作为点、什么作为边,边的权重如何产生将很大程度的影响最后的算法效果,因此,利用该种方法识别风险对象适用范围较窄。
由此可见,目前,在样本比较少的风控场景中,不存在一个准确率高、覆盖率广、鲁棒性强的识别风险对象的方案。
发明内容
本说明书实施例提供一种识别风险对象的方法、装置及设备。解决了在样本比较少的风控场景中,不存在一个准确率高、覆盖率广、鲁棒性强的识别风险对象的模型的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种识别风险对象的方法,该方法包括:
获取多个待识别对象,所述待识别对象至少包括事件和/或所述事件对应的介质信息;
根据所述事件和/或所述事件对应的介质信息,创建构图,得到至少一种构图;
根据在训练分类器过程中对构图上某一时间点前的事件和/或介质信息进行打标的标签信息及构图上边的权重,确定构图上的每个事件和/或介质信息的特征;
根据构图上的事件和/或介质信息的特征,利用训练好的分类器对某一时间点后的事件和/或介质信息进行分类,得到待识别对象中的风险对象。
优选地,所述根据所述事件和/或所述事件对应的介质信息,创建构图,得到至少一种构图,包括:以所述事件和/或所述事件对应的介质信息作为点,以所述事件和/或所述事件对应的介质信息之间的权重作为边,创建构图,得到至少一种构图。
优选地,所述以所述事件和/或所述事件对应的介质信息作为点,以所述事件和/或所述事件对应的介质信息之间的权重作为边,创建构图,得到至少一种构图,包括:
以所述事件作为点,以所述事件之间的权重作为边,创建构图,得到至少一种构图;或
以所述介质信息作为点,以所述介质信息之间的权重作为边,创建构图,得到至少一种构图;或
以所述事件和所述介质信息作为点,以所述事件之间的权重、所述介质信息之间的权重及所述事件和所述介质信息之间的权重作为边,创建构图,得到至少一种构图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910003877.9/2.html,转载请声明来源钻瓜专利网。





