[发明专利]基于社会网络分析技术的数据挖掘的一种方法在审
申请号: | 202110704883.4 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113408207A | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 祖玉宁 | 申请(专利权)人: | 上海硕恩网络科技股份有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06Q40/02;G06F16/2458;G06F16/28;G06F16/35;G06F40/30;G06F16/951;G06F9/50 |
代理公司: | 北京贵都专利代理事务所(普通合伙) 11649 | 代理人: | 李新锋 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 社会 网络分析 技术 数据 挖掘 一种 方法 | ||
1.基于社会网络分析技术的数据挖掘的一种方法,其特征在于,包括:征信风控建模、特征变量库、仿真数据库以及场景变量数据挖掘四个模块;
所述征信风控建模的具体操作步骤如下:
S1.准备数据,收集存量数据样本;
S2.对数据样本进行预处理,根据数据样本的属性建立特征变量宽表数据集;
S3.对所述数据集进行划分,将数据集划分成训练集、测试集和验证集;
S4.建立训练模型;
S5.使用训模型训练,并调整损失函数和优化器;
S6.评分卡生成,使用S2中所述测试机评估训练模型的测试准确度;
S7.公布,并在业务场景中应用;
S8.应用的数据沉淀并反馈至S1处进入收集的样本中;
所述特征变量库用于根据所述信贷客户的行为数据构造行为序列,并生成特征向量;所述特征变量库以提取出所述信贷客户的属性特征变量、关系特征变量、行为特征变量以及规则变量,并根据所述属性特征变量、关系特征变量、行为特征变量以及规则变量构建特征变量表;
所述仿真数据库是严格按照数据源格式,人工制作的高度仿真真实数据的数据集;
所述场景变量数据挖掘的具体步骤如下:获取行为特征查询语句,所述行为特征查询语句中包括请求查询的行为特征信息;在标注场景数据库中查询与所述行为特征信息对应的标注场景数据;根据查询到的标注场景数据对应的时间标签,从原始场景数据库中提取查询到的场景数据,生成特征场景数据。
2.根据权利要求1所述的基于社会网络分析技术的数据挖掘的一种方法,其特征在于,所述数据样本包括用户的基本信息数据,银行交易流水信息数据,产品持有信息数据,征信数据。
3.根据权利要求1所述的基于社会网络分析技术的数据挖掘的一种方法,其特征在于,该方法还包括征信风控评分卡建模,所述征信风控评分卡建模包括客户信息采集模块以及信用评分模型建立模块,客户信息采集模块用于采集客户的信用历史、行为偏好、履约能力、身份特质以及人脉关系。
4.根据权利要求3所述的基于社会网络分析技术的数据挖掘的一种方法,其特征在于,客户信息采集模块包括搜索引擎以及存储单元,用于根据借款人提交的年龄、收入、职业、学历、资产、负债信息,并查询系统里的相关征信数据,并记录到存储单元内;客户信息采集模块包括爬虫引擎,爬虫引擎用于根据借款人的信息到互联网上实时、不间断抓取社交、电商、通信、出行等互联网数据,经过处理后存并记录到存储单元内;征信风控评分卡建模通过基于深度学习,组合多种算法,构建出十几个风控模型,发现有区分用户风险的特性,进而建立模型,对用户进行打分,计算平均违约率。
5.根据权利要求1所述的基于社会网络分析技术的数据挖掘的一种方法,其特征在于,所述仿真数据库通过在网站或者移动端嵌入设备识别脚本,获取客户手机的位置信息以及社交活动轨迹,用于识别出用户是否存在经常换手机卡、刻意隐藏个人信息、短期内故意暴露个人信息等情况。
6.根据权利要求1所述的基于社会网络分析技术的数据挖掘的一种方法,其特征在于,所述特征变量库是将原始数据转化为特征的过程,这些特征可以更好地向预测模型描述潜在问题,从而提高模型对未见数据的精准识别能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海硕恩网络科技股份有限公司,未经上海硕恩网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110704883.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种商用车同步器寿命的实时监测方法及监测装置
- 下一篇:功率半导体器件