[发明专利]一种基于网络结构特征选择的信用卡违约预测方法有效
申请号: | 202010269692.5 | 申请日: | 2020-04-08 |
公开(公告)号: | CN112073147B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 胡艳梅;多滨 | 申请(专利权)人: | 成都理工大学 |
主分类号: | H04L1/00 | 分类号: | H04L1/00 |
代理公司: | 昆明合众智信知识产权事务所 53113 | 代理人: | 刘静怡 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 结构 特征 选择 信用卡 违约 预测 方法 | ||
1.一种基于网络结构特征选择的信用卡违约预测方法,其特征在于:包括以下步骤:
A构建特征网络:1)为每张信用卡的每个属性各创建一个特征节点,包括:卡号、开卡日期、最近消费额度,日均消费额、夜消费额、最高消费额;2)添加节点之间的边:计算矩阵中每两列之间的相关性系数,若计算出的相关性系数的绝对值大于给定阈值,则在相应的两节点之间添加一条边,且该边的权值为计算出的相关性系数的绝对值;
给定含n个样本的数据集T={(x1,y1),(x2,y2),…,(xn,yn)},其中为样本或记录xi在d个特征上的取值组成的d维特征向量,yi∈{0,1}为样本xi的标签,由所有的xi组成一个n×d的矩阵X;Xi,j表示矩阵X的第i行和第j列的元素,X*,j表示矩阵X的第j列;
步骤B:特征组划分:1)通过可视化结果图进行社区结构发现;2)将属于同一个社区的特征组成一个特征组;
C构建特征选择器:
1):采用逻辑斯蒂回归模型作为分类或预测模型,
即:其中w=(w1,w2,…,wd)称为权值向量,wi表示第i个特征对应的权值,b称为偏置,wT·x为w和x的内积;
2):运用“极大似然法”估计参数w和b;
给定训练数据集T={(x1,y1),(x2,y2),…,(xn,yn)},似然损失函数为:
3):将扩展后的稀疏组作为惩罚项,即:其中D是对角矩阵,对角线上的元素值分别为相应特征节点的加权度,||D-1w||1为权值向量w的受特征节点加权度限制的L1范数,控制特征层面的选择,是特征组上的L2,1范数且控制特征组层面的选择,其中K指从特征网络中发现的特征组总个数,Cg指第g个特征组,而λ1,λ2≥0;特征选择器具体为:
D选择特征子集:根据步骤C选出信用卡违约特征子集;
E预测违约几率;将新的信用卡样本,只取步骤D中的对应的特征值的数据。
2.根据权利要求1所述的一种基于网络结构特征选择的信用卡违约预测方法,其特征在于:步骤D具体的是采用梯度下降法作为基本求解方法,并在每一次迭代求解过程中运用近似算子和Moreau-Yosida正则化求解。
3.根据权利要求2所述的一种基于网络结构特征选择的信用卡违约预测方法,其特征在于:步骤A中的相关性系数具体的为:皮尔逊相关性系数、斯皮尔曼相关性系数和余弦相似性,具体的为:
其中1≤i,j,k≤n,Xi,j表示矩阵X中第i行和第j列的元素,X*,j表示矩阵X的第j列,为X*,j中所有元素的平均值,rij为Xi,j在X*,j中的等级,为X*,j中所有元素的平均等级,pc(j,k)指X*,j和X*,k的皮尔逊相关性系数,rc(j,k)指X*,j和X*,k的斯皮尔曼相关性系数,cc(j,k)指X*,j和X*,k的余弦相似性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269692.5/1.html,转载请声明来源钻瓜专利网。