[发明专利]识别欺诈用户的方法、装置、服务器和存储介质在审
申请号: | 201911410138.8 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111125658A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 钱信羽 | 申请(专利权)人: | 深圳市分期乐网络科技有限公司 |
主分类号: | G06F21/31 | 分类号: | G06F21/31;G06N3/04 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 518000 广东省深圳市南山区粤海*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 欺诈 用户 方法 装置 服务器 存储 介质 | ||
本发明实施例提供了一种识别欺诈用户的方法、装置、服务器和存储介质。该识别欺诈用户的方法包括:获取待识别用户的用户行为数据和参考用户的参考行为数据;基于所述用户行为数据和参考行为数据的比对结果,确定所述待识别用户和参考用户的相似度;基于所述相似度判断所述待识别用户是否为欺诈用户。通过待识别用户和参考用户的相似度确定待识别用户是否为欺诈用户,达到提高识别欺诈用户的准确度的效果。
技术领域
本发明实施例涉及风险识别技术领域,尤其涉及一种识别欺诈用户的方法、装置、服务器和存储介质。
背景技术
目前,常用的识别欺诈用户的方式是利用有标签数据进行无监督建模(如聚类)。无监督建模是指在得到的各类别群组中,计算各组的欺诈占比,将欺诈占比较高的群组判断为坏群组。根据坏群组中的欺诈用户的特点进行无监督建模,得到识别模型。将需要进行识别的用户输入识别模型,从而判断该用户是否为欺诈用户。
然而,进行无监督建模的方式中,由于常用的KNN,k-means等方法在高维数据中算法本身具有较大的不确定和不稳定性,导致得到的结果往往也不稳定,识别的效果不准确。
发明内容
本发明实施例提供一种识别欺诈用户的方法、装置、服务器和存储介质,以实现提高识别欺诈用户的准确度的效果。
第一方面,本发明实施例提供了一种识别欺诈用户的方法,包括:
获取待识别用户的用户行为数据和参考用户的参考行为数据;
基于所述用户行为数据和参考行为数据的比对结果,确定所述待识别用户和参考用户的相似度;
基于所述相似度判断所述待识别用户是否为欺诈用户。
可选的,所述基于所述用户行为数据和参考行为数据的比对结果,确定所述待识别用户和参考用户的相似度,包括:
根据所述用户行为数据计算所述待识别用户对应的第一特征向量;
根据所述参考行为数据计算所述参考用户对应的第二特征向量;
计算所述第一特征向量和第二特征向量的特征距离;
将所述特征距离作为所述待识别用户和参考用户的相似度。
可选的,所述根据所述用户行为数据计算所述待识别用户对应的第一特征向量包括:
将所述用户行为数据输入基于第一预设模型的卷积神经网络;
获取基于所述卷积神经网络计算得到的第一特征向量。
可选的,所述参考用户为无欺诈行为记录的用户,所述基于所述相似度判断所述待识别用户是否为欺诈用户,包括:
判断所述相似度是否大于预设阈值;
当所述相似度大于所述预设阈值时,则判断所述待识别用户为欺诈用户。
可选的,所述待识别用户为多个,所述基于所述相似度判断所述待识别用户是否为欺诈用户,包括:
根据每一个待识别用户的相似度对多个待识别用户进行分组,得到至少一个待识别群组,所述待识别群组对应至少一个待识别用户;
判断每一个所述待识别群组是否存在欺诈用户;
当所述待识别群组存在所述欺诈用户时,则判断所述待识别群组对应的所有待识别用户均为所述欺诈用户。
可选的,所述基于所述用户行为数据和参考行为数据的比对结果,确定所述待识别用户和参考用户的相似度,包括:
将所述用户行为数据和参考行为数据作为一个识别样本输入至训练好的第二预设模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市分期乐网络科技有限公司,未经深圳市分期乐网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911410138.8/2.html,转载请声明来源钻瓜专利网。