[发明专利]一种互联网征信评估方法和系统在审
申请号: | 201710117748.3 | 申请日: | 2017-03-01 |
公开(公告)号: | CN108537397A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 黎新 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评估模型 训练数据集 评估 权重 互联网 训练数据 训练样本 应用效果 预设策略 预设 合理性 | ||
本发明实施例公开了一种互联网征信评估方法和系统;本发明实施例在得到训练数据集后,可以按照预设策略为该训练数据集中的各个训练样本设置权重,然后,采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型,并基于该训练后评估模型对用户的互联网征信进行评估;该方案可以大大提高评估的合理性和准确性,改善应用效果。
技术领域
本发明涉及通信技术领域,具体涉及一种互联网征信评估方法和系统。
背景技术
随着大数据时代的来临,互联网征信的应用也越来越为广泛,其除了可以应用于互联网金融之外,还可以覆盖到其他的生活场景,比如打车、租车或酒店预订等,因此,如何保证互联网征信评估的准确和公平,也逐渐成为人们所关注的问题。
在现有技术中,一般可以通过收集用户的在训练期的行为数据作为训练数据集,然后,从中提取用户特征,利用决策树、以及逻辑回归等机器学习算法,来建立信用评分模型,并基于该信用评分模型对用户的信用进行评估。其中,训练数据集由违约用户和非违约用户组成,并切分成训练集和验证集,训练集用于训练模型,验证集用于对得到的模型进行评估,而评估的标准就是在验证集上的预测误差尽量小,该预测误差主要是预测违约情况(即预测用户是否违约)与真实违约情况的差异。
在对现有技术的研究和实践过程中,本发明的发明人发现,现有的互联网征信评估不够合理,准确性不高,导致应用效果不佳。
发明内容
本发明实施例提供一种互联网征信评估方法和系统,可以提高评估的合理性和准确性,改善应用效果。
本发明实施例提供一种互联网征信评估方法,包括:
获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;
从所述用户数据中选择训练样本,得到训练数据集;
按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;
采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;
基于所述训练后评估模型对用户的互联网征信进行评估。
本发明实施例还提供一种互联网征信评估系统,包括:
获取单元,用于获取多个用户数据,所述用户数据包括用户的属性数据、行为数据和信用记录;
选择单元,用于从所述用户数据中选择训练样本,得到训练数据集;
设置单元,用于按照预设策略为所述训练数据集中的各个训练样本设置权重,得到带权重的训练数据集;
训练单元,用于采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型;
评估单元,用于基于所述训练后评估模型对用户的互联网征信进行评估。
本发明实施例在得到训练数据集后,可以按照预设策略为该训练数据集中的各个训练样本设置权重,然后,采用带权重的训练数据集对预设评估模型进行训练,得到训练后评估模型,并基于该训练后评估模型对用户的互联网征信进行评估;由于该方案可以按照预设策略为各个训练样本设置权重,再据此进行模型训练,因此,有利于对不同训练样本的违约影响进行区分,相对于现有只考虑训练样本是否违约的评估方案而言,可以大大提高评估的合理性和准确性,改善应用效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本发明实施例提供的互联网征信评估方法的框架图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710117748.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种粮食安全脆弱性分析方法及系统
- 下一篇:人力资源对象分类方法及装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理