[发明专利]客户信用评价方法及装置在审
| 申请号: | 202110123755.0 | 申请日: | 2021-01-29 |
| 公开(公告)号: | CN112801775A | 公开(公告)日: | 2021-05-14 |
| 发明(设计)人: | 刘吉超;王文春;侯海波;吴欢 | 申请(专利权)人: | 中国工商银行股份有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N20/00 |
| 代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;孙乳笋 |
| 地址: | 100140 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 客户 信用 评价 方法 装置 | ||
本发明提供了一种客户信用评价方法及装置,方法包括:采集待评价客户的信用评价数据;根据信用评价数据和预先建立的信用评价模型对待评价客户进行信用评价;其中,所述信用评价模型为利用输入特征数据进行模型训练得到的,所述的输入特征数据为根据预设的信息值阈值从经过特征选取及离散处理的预设的模型训练用的信用评价数据中确定的。本发明属于物联网领域,也可用于金融领域,提供一种有效的客户信用评价方法,针对于银行中的信贷业务,有效提高银行风险控制能力,降低银行审核成本、提升银行的风控效率和准确率。
技术领域
本发明涉及数据处理技术,具体的讲是一种客户信用评价方法及装置。
背景技术
当前随着经济社会的发展,银行的互联网金融产品高速发展。银行在互联网上提供信贷服务的同时,需要对信贷客户的信息进行快速全面的审核,以此来降低客户的违约风险。在这种情况下,原先的人工审核办法已无法满足现实需求。一批通过机器学习训练出的信用评分方法,因为其快速、高效的优良性能逐渐占据了市场。
现有技术中,常用的客户信用评分方法大多数都是采用单一的模型算法例如:SVM、神经网络、树模型算法等等。但是现阶段的这些算法所训练出的模型存在着一些问题,一方面上述有的算法产生非线性、非连续的函数来拟合用户数据,会降低模型的可解释性;此外,这些方法在模型构建过程中的特征工程阶段,没有很好的发掘数据中的有用信息,造成了信息的浪费,从而导致模型预测在精度上的下降。另外,传统的基于单个模型的信用评分方法不能全面的刻画用户的信用全貌,单个模型在泛化性上也有所欠缺。
发明内容
针对现有技术中信用评分所存在不足,本发明提供了一种客户信用评价方法,包括:
采集待评价客户的信用评价数据;
根据所述信用评价数据和预先建立的信用评价模型对待评价客户进行信用评价;其中,所述信用评价模型为利用输入特征数据进行模型训练得到的,所述的输入特征数据为根据预设的信息值阈值从经过特征选取及离散处理的预设的模型训练用的信用评价数据中确定的。
本发明实施例中,所述的信用评价数据包括:客户个人信息特征数据、客户信用往来特征数据、客户财产状况特征数据、客户行为偏好特征数据、客户的运营商信息特征数据及逾期标识数据。
本发明实施例中,所述的方法包括:利用预设的信用评价数据进行训练和预设的初始信用评价模型确定建立的信用评价模型;其中,
获取模型训练用的预设的信用评价数据;
对所述的信用评价数据进行特征选取确定候选特征数据;
对所述的候选特征数据进行离散化;
根据离散化的候选特征数据的信息值和预设的信息值阈值从所述的候选特征数据中确定输入特征数据;
根据确定的输入特征数据对预设的初始信用评价模型进行训练确定建立的信用评价模型。
本发明实施例中,所述的对所述的信用评价数据进行特征选取确定候选特征数据之前包括:
对所述的信用评价数据进行预处理,删除信用评价数据中的重复数据、异常数据。
本发明实施例中,所述的对所述的信用评价数据进行特征选取确定候选特征数据包括:
利用有监督的机器学习算法从所述信用评价数据中确定第一候选特征数据;
利用无监督的机器学习算法从所述信用评价数据中确定第二候选特征数据;
将所述的第一候选特征数据和第二候选特征数据作为所述候选特征数据。
本发明实施例中,所述的对所述的候选特征数据进行离散化包括:
利用卡方分箱对所述的候选特征数据进行离散化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110123755.0/2.html,转载请声明来源钻瓜专利网。





