[发明专利]基于随机森林的异常用户识别方法及装置、设备、介质在审
申请号: | 201810960853.8 | 申请日: | 2018-08-22 |
公开(公告)号: | CN109241418A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 陈伟源 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/2458;G06K9/62 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供了一种基于随机森林模型的异常用户识别方法及装置,属于大数据技术领域。该方法包括:按照预设属性从历史用户的信息中统计出样本数据,并获取所述历史用户的分类标签,其中,所述预设属性包括第一类属性及第二类属性;利用所述样本数据及所述分类标签训练随机森林模型,在训练过程中,所述第一类属性对应于第一抽样概率,所述第二类属性对应于第二抽样概率,第一抽样概率大于第二抽样概率;按照所述预设属性从待识别用户的信息中统计出目标数据,并通过训练后的所述随机森林模型处理所述目标数据,以确定所述待识别用户是否为异常用户。本公开可以降低异常用户识别方法所需的样本数据量,并提高识别的准确性。 | ||
搜索关键词: | 抽样概率 随机森林 异常用户 样本数据 类属性 预设 分类标签 历史用户 目标数据 模型处理 训练过程 大数据 统计 | ||
【主权项】:
1.一种基于随机森林模型的异常用户识别方法,其特征在于,包括:按照预设属性从历史用户的信息中统计出样本数据,并获取所述历史用户的分类标签,其中,所述预设属性至少包括第一类属性及第二类属性;利用所述样本数据及所述分类标签训练随机森林模型,在训练过程中,所述第一类属性对应于第一抽样概率,所述第二类属性对应于第二抽样概率,所述第一抽样概率大于所述第二抽样概率;按照所述预设属性从待识别用户的信息中统计出目标数据,并通过训练后的所述随机森林模型处理所述目标数据,以确定所述待识别用户是否为异常用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810960853.8/,转载请声明来源钻瓜专利网。