[发明专利]基于多机器学习模型并行的风控模型应用方法和系统在审
| 申请号: | 201711184294.8 | 申请日: | 2017-11-23 |
| 公开(公告)号: | CN107730154A | 公开(公告)日: | 2018-02-23 |
| 发明(设计)人: | 蒋宏 | 申请(专利权)人: | 安趣盈(上海)投资咨询有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
| 代理公司: | 北京市汉坤律师事务所11602 | 代理人: | 段志超 |
| 地址: | 200062 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 机器 学习 模型 并行 应用 方法 系统 | ||
1.一种基于多机器学习模型并行的风控模型应用方法,包括线下风控模型应用方法,其中该线下风控模型应用方法包括
采集申请客群信息;
从上述信息中提取客户画像数据;
对上述画像数据进行处理,计算风险相关指标;
对上述风险相关指标分别利用不同的特征选择模型进行处理得到相应的单个模型特征排序;
对得到的相应单个模型特征排序进行综合排序;
以及对综合排序后的特征分别利用多个机器学习模型进行建模处理,评价各个机器学习模型的运行效果,筛选出排名靠前的若干机器学习模型。
2.如权利要求1所述的方法,所述综合排序的方法为平均加权或根据特征选择模型的选择效果加权。
3.如权利要求1-2之一所述的方法,综合排序后选择排名靠前的若干特征作为综合排序后保留的特征,送入所述机器学习模型进行建模处理。
4.如权利要求1-3之一所述的方法,评价各个机器学习模型的运行效果的方法为ROC曲线法或KS指标法。
5.如权利要求1-4之一所述的方法,申请客群信息为从申请流量信息中选取的代表性客户群的相关信息。
6.如权利要求5所述,申请流量信息来源包括申请客户提交的数据信息、爬虫抓取的数据、以及通过互联网数据接口获取的信息。
7.如权利要求1-6之一所述的方法,特征选择模型至少包括Xgboost模型、Randomforest模型、Lasso模型、GBDT模型、DecisionTree模型、和GeneticAlgorithms模型。
8.如权利要求1-7之一所述的方法,机器学习模型至少包括Xgboost模型、Neural network模型、SVM模型、LogisticRegression模型、AdaBoost模型、RandomForest模型和NaiveBayes模型。
9.一种基于多机器学习模型并行的风控模型应用方法,包括线上风控模型应用方法,其中该线上风控模型应用方法包括
采集申请客群信息;
从上述信息中提取客户画像数据;
对上述画像数据进行处理,计算风险相关指标;
将如权利要求1-8之一所述的方法中筛选出的排名靠前的若干机器学习模型作为投入使用的线上机器学习模型;
将所述风险相关指标送入线上机器学习模型中相应的机器学习模型进行处理;
以及将处理结果作为是否授信的决策依据。
10.如权利要求9所述的方法,申请客群信息为从申请流量信息中选取的代表性客户群的相关信息。
11.如权利要求9-10之一所述的方法,根据线上机器学习模型中各机器学习模型的排名高低分配申请流量到相应的机器学习模型,机器学习模型排名越高,分配的申请流量越多。
12.如权利要求11所述的方法,通过KS指标法对所述机器学习模型进行排名,根据各机器学习模型KS值的权重进行流量比例分配。
13.如权利要求9-12之一所述的方法,定期训练线下机器学习模型并对线下风控模型中的各机器学习模型的运行效果进行评估,根据评估结果更新线上投入使用的机器学习模型。
14.如权利要求10-13之一所述,申请流量信息来源包括申请客户提交的数据信息、爬虫抓取的数据、以及通过互联网数据接口获取的信息。
15.一种基于多机器学习模型并行的风控模型应用系统,包括线下风控模型应用系统,其中该线下风控模型应用系统包括
数据采集模块,其用于采集申请客群信息;
数据提取模块,从申请客群信息中提取客户画像数据;
数据计算模块,对上述画像数据进行处理,计算风险相关指标;
特征选择模块,对上述风险相关指标分别利用不同的特征选择模型进行处理得到相应的单个模型特征排序;
特征综合排序模块,对所得到的单个模型特征排序进行综合排序;
线下机器学习并行模块,利用多个机器学习模型对排序后的特征分别进行建模处理;
以及机器学习模型评价筛选模块,评价各个机器学习模型的运行效果的优劣,筛选出排名靠前的若干机器学习模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安趣盈(上海)投资咨询有限公司,未经安趣盈(上海)投资咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711184294.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





