[发明专利]用户分类方法、装置、计算机设备和存储介质在审
申请号: | 202111327250.2 | 申请日: | 2021-11-10 |
公开(公告)号: | CN114022712A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 张珂欣;王坤;董江雪;候晨 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06K9/62;G06Q40/02 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 钟善宝 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用户 分类 方法 装置 计算机 设备 存储 介质 | ||
1.一种用户分类方法,其特征在于,所述方法包括:
获取待分类用户的画像信息,所述画像信息包括用户属性信息以及用户交易信息;
将所述待分类用户的画像信息输入至分类模型中,得到所述待分类用户的用户类别,所述分类模型是根据逻辑回归模型以及接受者操作特征ROC曲线获得的,所述用户类别包括第一类用户和第二类用户,所述ROC曲线用于表征所述分类模型的预测精度,所述第一类用户为催收难度大于预设阈值的用户,所述第二类用户为催收难度小于预设阈值的用户。
2.根据权利要求1所述的用户分类方法,其特征在于,所述分类模型的获取方式包括:
获取历史用户信息,所述历史用户信息包括多个用户的画像信息和各用户的第一类别;所述第一类别为所述用户实际的用户类别;
将所述历史用户信息分为训练样本集和验证样本集;
利用所述训练样本集训练所述逻辑回归模型,获得初始模型;根据所述初始模型以及所述验证样本集,确定所述ROC曲线;
基于所述ROC曲线对所述初始模型的预测效果进行评估,并根据评估结果以及所述初始模型确定所述分类模型。
3.根据权利要求2所述的用户分类方法,其特征在于,所述利基于所述ROC曲线对所述初始模型的预测效果进行评估,并根据评估结果以及所述初始模型确定所述分类模型,包括:
利用所述初始模型对所述验证样本集中各用户的画像信息进行预测,得到所述验证样本集中各用户的预设数量的第二类别,所述第二类别为所述验证样本集中各用户预测的用户类别;
根据所述验证样本集中所述各用户的所述第一类别以及所述预设数量的第二类别,构建所述预设数量的混淆矩阵;
根据所述预设数量的混淆矩阵,确定所述ROC曲线。
4.根据权利要求3所述的用户分类方法,其特征在于,所述利用所述初始模型对所述验证样本集中各用户的画像信息进行预测,得到所述验证样本集中各用户的预设数量的第二类别,包括:
利用所述初始模型对所述验证样本集中各用户的画像信息进行预测,得到所述验证样本集中各用户的预测概率;
基于所述预设数量的概率阈值与所述预测概率,确定所述验证样本集中各用户的所述预设数量的第二类别。
5.根据权利要求4所述的用户分类方法,其特征在于,所述根据所述验证样本集中所述各用户的所述第一类别以及所述预设数量的第二类别,构建预设数量的混淆矩阵,包括:
根据各所述概率阈值对应所述验证样本集中各用户的第一类别以及第二类别,构建各所述概率阈值的混淆矩阵,以得到所述预设数量的混淆矩阵。
6.根据权利要求5所述的用户分类方法,其特征在于,所述根据所述预设数量的混淆矩阵,确定所述ROC曲线,包括:
根据各所述混淆矩阵,确定所述初始模型的错误率以及查全率;其中,所述错误率用于表征所述验证样本集中,所述第一类别为所述第二类用户且所述第二类别为所述第一类用户,在所述第二类别为所述第一类用户中的占比;所述查全率用于表征所述验证样本集中,所述第一类别与所述第二类别均为所述第一类用户,在所述第一类别为所述第一类用户中的占比;
根据各所述混淆矩阵对应的所述错误率以及所述查全率,确定所述ROC曲线。
7.根据权利要求2所述的用户分类方法,其特征在于,所述基于所述ROC曲线对所述初始模型的预测效果进行评估,并根据评估结果以及所述初始模型确定所述分类模型,包括:
确定所述ROC曲线下的面积AUC,根据所述AUC的值调整所述初始模型的参数,在所述AUC大于期望值时,将参数调整后的所述初始模型确定为所述分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111327250.2/1.html,转载请声明来源钻瓜专利网。