[发明专利]基于随机森林的异常用户识别方法及装置、设备、介质在审
申请号: | 201810960853.8 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109241418A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 陈伟源 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458;G06K9/62 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 抽样概率 随机森林 异常用户 样本数据 类属性 预设 分类标签 历史用户 目标数据 模型处理 训练过程 大数据 统计 | ||
本公开提供了一种基于随机森林模型的异常用户识别方法及装置,属于大数据技术领域。该方法包括:按照预设属性从历史用户的信息中统计出样本数据,并获取所述历史用户的分类标签,其中,所述预设属性包括第一类属性及第二类属性;利用所述样本数据及所述分类标签训练随机森林模型,在训练过程中,所述第一类属性对应于第一抽样概率,所述第二类属性对应于第二抽样概率,第一抽样概率大于第二抽样概率;按照所述预设属性从待识别用户的信息中统计出目标数据,并通过训练后的所述随机森林模型处理所述目标数据,以确定所述待识别用户是否为异常用户。本公开可以降低异常用户识别方法所需的样本数据量,并提高识别的准确性。
技术领域
本公开涉及大数据技术领域,尤其涉及一种基于随机森林模型的异常用户识别方法及装置、电子设备、计算机可读存储介质。
背景技术
互联网以及各种基于互联网的应用程序(Application,简称App)极大的方便了人们的生活,然而也有一些用户通过滥用互联网或App服务获取不正当利益,例如网络上出现的虚假用户、虚假“粉丝”、恶意刷单、恶意广告等异常用户及异常行为,影响了网站或App的正常运营,损害了运营方及正常用户的利益,因此需要将这些异常用户识别出来并进行处理。
现有的异常用户识别方法多数是建立异常行为的数据库,然后将待识别用户的行为数据与该数据库进行匹配,例如进行正则匹配或计算行为数据的余弦相似度等,根据匹配的程度判断用户是否异常用户。然而该方法具有以下缺点:用户行为具有复杂的多样性,建立完整的数据库需要大量的样本数据,在样本数据较少时难以适用该方法,并且通过数据库匹配难免会产生遗漏,影响识别结果的准确性;此外,在匹配时需要遍历数据库中的全部数据,较为耗时且占用较多资源,因此识别过程的效率较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种基于随机森林模型的异常用户识别方法及装置、电子设备、计算机可读存储介质,进而至少在一定程度上克服现有异常用户识别方法需要大量样本数据以及准确性较低的问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开的一个方面,提供一种基于随机森林模型的异常用户识别方法,包括:按照预设属性从历史用户的信息中统计出样本数据,并获取所述历史用户的分类标签,其中,所述预设属性包括第一类属性及第二类属性;利用所述样本数据及所述分类标签训练随机森林模型,在训练过程中,所述第一类属性对应于第一抽样概率,所述第二类属性对应于第二抽样概率,所述第一抽样概率大于所述第二抽样概率;按照所述预设属性从待识别用户的信息中统计出目标数据,并通过训练后的所述随机森林模型处理所述目标数据,以确定所述待识别用户是否为异常用户。
在本公开的一种示例性实施例中,所述预设属性包括N类属性,N≥3;所述利用所述样本数据及所述分类标签训练随机森林模型,在训练过程中,所述第一类属性对应于第一抽样概率,所述第二类属性对应于第二抽样概率,所述第一抽样概率大于所述第二抽样概率包括:利用所述样本数据及所述分类标签训练所述随机森林模型,在训练过程中,所述第一类属性对应于所述第一抽样概率,所述第二类属性对应于所述第二抽样概率,第i类属性对应于第i抽样概率,其中,所述第一抽样概率大于所述第二抽样概率,第i-1抽样概率大于所述第i抽样概率,i∈[3,N]。
在本公开的一种示例性实施例中,所述第一类属性为必然抽样属性,所述第一抽样概率为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810960853.8/2.html,转载请声明来源钻瓜专利网。