[发明专利]多维数据下的网贷借款人信用评价方法在审
| 申请号: | 201810704228.7 | 申请日: | 2018-06-25 |
| 公开(公告)号: | CN109325844A | 公开(公告)日: | 2019-02-12 |
| 发明(设计)人: | 梁雪春;王名豪 | 申请(专利权)人: | 南京工业大学 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06F17/27 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 211816 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信用数据 信用评价 结构化数据 大数据 公共事业机构 数据处理模块 个人信用 金融机构 情感倾向 数据平衡 政府部门 结构化数据模型 非结构化数据 模型构建模块 数据采集模块 采集 多维数据 非结构化 媒体数据 媒体文本 模型预测 评估数据 数据模块 随机森林 特征抽取 特征选择 文本数据 信用评估 互联网 决策树 冗余 算法 微博 评级 定性 反馈 参考 信用 改进 网络 分析 学习 研究 | ||
本发明公开了一种基于大数据的P2P借款人信用评价方法。本发明包括数据采集模块,数据处理模块,模型构建模块。在大数据时代,信用数据源不断扩大,主要包括以下四个方面:金融机构产生的信用数据,相关政府部门产生的信用数据,其它公共事业机构产生的信用数据,网络产生的互联网信用数据。数据模块主要分为两部分,将金融机构、相关政府部门、公共事业机构所产生的信用数据定性为结构化数据采集;互联网信用数据中的微信朋友圈和新浪微博等社交媒体数据作为非结构化数据采集。数据处理模块主要针对结构化数据,包括数据平衡化处理、特征选择。针对个人信用结构化数据存在不平衡现象,本发明使用CART‑SMOTE算法进行数据平衡化处理;大数据背景下个人信用评估数据特征繁杂,无关和冗余的变量会对模型预测的准确性造成不利的影响,本发明综合使用随机森林和梯度下降决策树进行评价特征的选择。结构化数据模型使用改进的lightGBM进行信用初步评级;对非结构化的社交文本数据进行特征抽取,使用深度学习进行信用评价及情感倾向分析。再将个人社交媒体文本数据中所展现的情感倾向反馈到P2P借款人的信用评估中,研究两者相关性。为最终的信用评价结构提供参考。
技术领域
本发明公开了一种P2P信用评估方法,涉及信息技术领域和信用服务技术领域。
背景技术
2015年,P2P网络借贷作为一种依托于互联网的新型金融模式,在国家“互联网+”与大数据服务实体经济的战略指导下,开始兴起并迅速发展壮大,截至2017年7月底,P2P网贷行业平台累计数量达到 5916家。然而,由于中国P2P网络借贷起步较晚,信用体系不完善,相关法律法规缺失,平台跑路和借款人不按时还款甚至携款潜逃等问题仍时有发生,暴露出了较为严重的资金安全问题。
国务院在《推进普惠金融发展规划》中指出“互联网金融对促进小微企业发展和扩大就业发挥了现有金融机构难以替代的积极作用,为大众创业、万众创新打开了大门”。但是,存在于P2P网贷中的问题已经不能忽视。本课题研究意义主要在于如何有效评价网贷借款人信用开展研究,并以此来促进互联网金融业的健康发展。
目前在我国信用评估体系还处于发展阶段,相比发达国家,仍面临着很多亟需解决的问题。主要存在以下问题:
1、非结构化信用信息挖掘和提炼:传统信用风险的量化管理是以财务数据、市场交易数据等定量信息为基础的,大数据时代海量的文本信息为分析个人信用的价值和违约倾向带来了新线索,如何提取非结构数据信息进行信用评估成为难点。
2、多维数据下的指标选择:目前公开常用的网贷信用借款人评估数据指标属性不统一,具有数据指标多、数据维数高、数据存在非线性和冗余性的特点,因此筛选出重要的特征指标显得尤为重要。
3、数据平衡化:信用评估数据中违约与不违约比例相差较大,如何做到数据平衡也是构建模型时的关键问题之一。
4、信用评估模型的建立,通过对前人信用评分模型研究成果的借鉴,构建一个适合我国网络贷款的信用评估模型。
本发明旨在对P2P网贷借款人信用信息进行量化分析,以此有效地规避网络信贷业务中的信用风险。帮助商业银行在办理个人消费信贷业务中规避信用风险,提高业务办理效率,以此促进我国个人信贷业务的发展和我国金融业的深化改革。
发明内容
本发明针对P2P信用评估体系中的不足,提供一种大数据背景下的P2P借款人的信用评估方法。在大数据的背景下,通过采集金融机构产生的信用数据,相关政府部门产生的信用数据,其它公共事业机构产生的信用数据,网络产生的互联网信用数据。以非结构化数据辅助结构化数据对P2P借款人进行信用评估。
为了解决上述技术问题,本发明提供了一种基于多维数据的P2P借款人信用评价方法,包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810704228.7/2.html,转载请声明来源钻瓜专利网。





