[发明专利]基于大数据的用户信用度评估方法、装置及存储介质有效
申请号: | 201910654699.6 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110503459B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 胡文成;贺义思 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q30/0201 | 分类号: | G06Q30/0201;G06Q10/0639;G06N3/006 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据 用户 信用度 评估 方法 装置 存储 介质 | ||
1.一种基于大数据的用户信用度评估方法,其特征在于,所述方法包括:
基于Bootstrap采样方法从预先构建的用户画像中进行数据抽样,构建随机森林模型,并将所述随机森林模型与logistic回归模型进行组合,生成大数据环境下的单个信用评估模型,其中所述用户画像是通过预设类型的用户数据进行构建的,所述预设类型的用户数据来源于互联网,包括静态信息数据和动态信息数据,其中:
所述静态信息数据包括用户的基本属性和商业信息,所述基本属性包括性别、年龄、地域、职业、婚姻状况,以及所述商业信息包括用户每次的消费金额、消费周期、消费等级;
所述动态信息数据包括用户在互联网上的不断发生变化的操作行为,包括每次浏览的网页、搜索的商品、对商品的评价、对商家的信誉反馈、转发的商家信息;
重复执行上述步骤N次,以得到N个所述单个信用评估模型,其中,N为大于1的正整数;
汇总所有上述单个信用评估模型,进行集成学习,生成一个集成信用评估模型;
获取待评估信用度的用户的数据,将所述用户的数据带入所述集成信用评估模型,得到所述用户的信用度。
2.如权利要求1所述的基于大数据的用户信用度评估方法,其特征在于,该方法还包括在构建所述用户画像时,对所述预设类型的用户数据进行处理,其中,所述处理包括对所述用户数据的归一化以及基于主成分分析的数据降维处理。
3.如权利要求2所述的基于大数据的用户信用度评估方法,其特征在于,所述归一化处理采用z-score归一化方法,其公式如下:
x=(x-μ)/σ,
其中,x为采集的原始预设类型的用户数据,μ为样本数据均值,σ为样本数据方差。
4.如权利要求1至3中任意一项所述的基于大数据的用户信用度评估方法,其特征在于,所述构建随机森林模型的方法包括:
(1)利用所述Bootstrap采样方法产生训练集;
(2)根据所述训练集,利用ID3算法构建决策树,如下所示:
Gain(D)=infobefore(D)-infoafter(D)
其中,Gain(D)为决策树节点信息增益,infobefore(D)和infoafter(D)分别为添加/摘除该节点情况下的信息熵;
(3)按照第(2)步的方法不断重复构建了第k棵决策树后,建立k个决策树的组合,以得到随机森林模型。
5.如权利要求4所述的基于大数据的用户信用度评估方法,其特征在于,所述集成学习步骤包括,利用Adaboost算法生成所述集成信用评估模型,其中,所述Adaboost算法的公式为:
其中,wt为第t个信用评估模型的权重,ht(x)为第t个信用评估模型的评估结果,N为单个信用评估模型的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910654699.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置