[发明专利]一种信用风险评估方法及系统在审
申请号: | 201810468030.3 | 申请日: | 2018-05-16 |
公开(公告)号: | CN108648068A | 公开(公告)日: | 2018-10-12 |
发明(设计)人: | 李传龙;田甜;罗忠辉 | 申请(专利权)人: | 长沙农村商业银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 卢宏;王娟 |
地址: | 410003 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信用 预处理 风险评估模型 测试样本集 训练样本集 风险评估 采集 合作方式 机构数据 内部数据 群体特征 第三方 评估 准确率 构建 网站 量化 测试 互联网 客户 外部 群体 银行 分析 | ||
1.一种信用风险评估方法,其特征在于,包括以下步骤:
1)采集外部公开网站的公开数据;
2)采用合作方式接入独立的互联网第三方征信机构数据,并结合银行内部数据;
3)对经步骤1)和步骤2)获取的数据进行预处理;
4)针对步骤3)预处理后的数据,根据群体特征划分群体,然后对划分了群体后的数据进行分析量化,并构造训练样本集和测试样本集,利用训练样本集构建信用风险评估模型,使用信用风险评估模型对测试样本集进行测试,评估信用等级。
2.根据权利要求1所述的信用风险评估方法,其特征在于,步骤1)的具体实现过程包括:
1)直接请求公开网站的网址,检测能否采集到相应的数据,若能,则获取对应数据;若不能,则采用无界面浏览器,结合自动化测试工具进行页面爬虫操作;
2)根据原始图像和缺失位置得到缺口的偏移量,然后模拟人工滑动操作,滑动至缺口完成本次验证码识别,如出现异常或错误,则继续下一次识别;
3)模拟输入页面参数或点击页面操作,进入所需页面,然后通过解析当前页面内容提取数据,直至循环获取全部所需页面并模拟相应页面操作,获取页面内容数据后,完成本次爬虫操作,如出现异常或错误,则中止本次操作。
3.根据权利要求1所述的信用风险评估方法,其特征在于,步骤2)的具体实现过程包括:
1)获取客户授权,完成与第三方征信机构的合作协议签订;
2)调用第三方征信机构的数据;
3)调用银行内部数据。
4.根据权利要求1所述的信用风险评估方法,其特征在于,步骤3)的具体实现过程包括:
1)对采集的数据进行数据清理;
2)采用数据集成方式将数据清理后的多个数据源的数据整合成一致的数据;
3)将整合成一致的数据进行归一化处理,使各指标处于同一数量级,然后进行分析量化。
5.根据权利要求1所述的信用风险评估方法,其特征在于,步骤4)中,针对训练样本集采用多级分类支持向量机,以高斯径向基核函数作为核函数,选取最优惩罚因子C和核函数g,构建信用风险评估模型。
6.根据权利要求5所述的信用风险评估方法,其特征在于,步骤4)的具体实现过程包括:
1)细化群体特征,根据群体特性将预处理后的样本数据集划分为工薪、私营企业主、农民、学生与其他群体;
2)从身份特征、履约能力、信用历史、消费特征、社交影响五个维度对步骤1)的数据进行分析量化,整合为有N个重要特征指标的样本数据集;
3)基于所述样本数据集,随机抽样部分数据构造为训练样本集,剩余数据构造为测试样本集,针对某单个群体,采用支持向量机构建该群体的信用风险评估模型;
4)根据测试样本集的群体特性,划分其群体,然后根据步骤3)建立的某个群体的信用风险评估模型,预测测试样本集的信用等级。
7.根据权利要求6所述的信用风险评估方法,其特征在于,N=90。
8.根据权利要求6所述的信用风险评估方法,其特征在于,随机抽样80%的构造为训练样本集,剩余20%的数据构造为测试样本集。
9.一种信用风险评估系统,其特征在于,包括:
采集模块:用于采集税务、司法、工商外部公开网站的公开数据;
接入模块:用于采用合作方式接入独立的互联网第三方征信机构数据,
并结合银行内部数据;
预处理模块:用于对采集的数据进行预处理;
评估模块:用于针对预处理后的数据,根据群体特征划分群体,然后对数据进行分析量化,并构造训练样本集和测试样本集,针对训练样本集采用多级分类支持向量机,以高斯径向基核函数作为核函数,选取最优惩罚因子C和核函数g,构建信用风险评估模型,使用信用风险评估模型对测试样本集进行测试,评估信用等级。
10.根据权利要求9所述的信用风险评估系统,其特征在于,所述评估模块包括:
分析量化单元:用于针对预处理后的数据,根据群体特征划分群体,然后对数据进行分析量化;
构造单元:用于构造训练样本集和测试样本集,针对训练样本集采用多级分类支持向量机,以高斯径向基核函数作为核函数,选取最优惩罚因子C和核函数g,构建信用风险评估模型;
测试评估单元:用于使用信用风险评估模型对测试样本集进行测试,评估信用等级。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙农村商业银行股份有限公司,未经长沙农村商业银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810468030.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:贷款审批方法、装置、计算机设备及存储介质
- 下一篇:一种任务检查方法和装置