[发明专利]一种基于网络结构特征选择的信用卡违约预测方法有效
申请号: | 202010269692.5 | 申请日: | 2020-04-08 |
公开(公告)号: | CN112073147B | 公开(公告)日: | 2022-08-19 |
发明(设计)人: | 胡艳梅;多滨 | 申请(专利权)人: | 成都理工大学 |
主分类号: | H04L1/00 | 分类号: | H04L1/00 |
代理公司: | 昆明合众智信知识产权事务所 53113 | 代理人: | 刘静怡 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 结构 特征 选择 信用卡 违约 预测 方法 | ||
本发明涉及分类、预测任务领域,是指一种基于网络结构特征选择的信用卡违约预测方法,解决了现有技术中特征之间复杂关系考虑不够的问题。本发明包括以下步骤:A构建特征网络;C构建特征选择器;D选择特征子集。本发明通过特征网络的构建和基于其上的特征组划分,充分挖掘了特征之间的复杂关系;本发明中的特征选择器综合考虑了特征网络的网络结构和特征在网络结构上的位置,在选择过程中充分利用了特征之间的复杂关系,解决现有技术中特征选择过程未充分考虑特征间的复杂关联关系导致结果不能满足模型需求的问题。
技术领域
本发明涉及分类、预测任务领域,特别是指一种基于网络结构特征选择的信用卡违约预测方法。
背景技术
分类和预测任务广泛存在各个领域,目前有很成熟的机器学习技术,如逻辑斯蒂回归、支持向量机等,但在特征数据维度高时,现有的技术无法满足需求,如高维度的特征导致分类和预测时间复杂度高,特征之间的复杂关系导致分类和预测结果不尽人意。
在分类和预测之前选取恰当的特征集,可提高分类和预测结果的性能,现有的特征选择方法大致可分为以下三类:
1、过滤式方法:先直接依照数据的分布给特征打分,然后选取分值较高的特征。该类方法独立于模型本身,简单且时间复杂度较低,但选择效果一般不能满足模型需求;
2、包裹式方法:首先输入每一个待选的特征子集分别训练模型,然后选择使得模型效果最好的特征子集,但这类方法依赖于具体的模型,因此容易出现过拟合且时间复杂度高;
3、嵌入式方法:将特征选择作为学习模型的一部分,在模型的学习过程中会对每个特征进行度量,然后依照指标值和模型效果选取特征。该类方法折中了前两类方法,能在相对较低的时间复杂度内取得一定的效果,但由于未考虑特征之间的复杂关系,其结果仍然需要进一步提升以满足应用需求。
虽然第三类方法相较前两类有显著的优势,但该类方法存在如下缺点:在训练学习模型前要么未考虑特征之间的关联关系,要么简单地将特征按照功能或区域划分成不同的组,比如,相同功能的蛋白质是一组,照片中眼睛部位的像素是一组。然而,在许多实际应用中,特征之间的关联关系是复杂且隐式的,尤其是在特征维度较高的情况下。由于现有的特征选择方法均未挖掘特征之间的潜在复杂关系并将其有效地应用于特征选择过程中,它们已不能满足实际应用需求。
亟待出现一种可解决上述问题的新型的特征选择方法。
发明内容
本发明提出一种基于网络结构特征选择的信用卡违约预测方法,解决了现有技术中信用卡违约预测不准确的问题。
本发明的技术方案是这样实现的:一种基于网络结构特征选择的信用卡违约预测方法,包括以下步骤:
A构建特征网络:1)为每个特征创建一个节点;2)添加节点之间的边:计算矩阵中每两列之间的相关性系数,若计算出的相关性系数的绝对值大于给定阈值,则在相应的两节点之间添加一条边,且该边的权值为计算出的相关性系数的绝对值;给定含n个样本的数据集T={(x1,y1),(x2,y2),…,(xn,yn)},其中为样本或记录xi在d个特征上的取值组成的d维特征向量,yi∈{0,1}为样本xi的标签,由所有的xi组成一个n×d的矩阵X;Xi,j表示矩阵X的第i行和第j列的元素,X*,j表示矩阵X的第j列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269692.5/2.html,转载请声明来源钻瓜专利网。