[发明专利]一种批量获取样本指标和入库的方法、装置及介质在审
申请号: | 202111609418.9 | 申请日: | 2021-12-27 |
公开(公告)号: | CN114266651A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 王小聪;杨宝华;崔乐乐 | 申请(专利权)人: | 天元大数据信用管理有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q40/08;G06F16/22;G06F16/25 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 姜丽洁 |
地址: | 250100 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 批量 获取 样本 指标 入库 方法 装置 介质 | ||
本发明涉及指标数据入库领域,具体提供了一种批量获取样本指标和入库的方法,具有如下步骤:S1、新建数据库连接和数据表;S2、批量读取样本的名称;S3、通过读取到的样本批量调用接口计算指标;S4、将计算完成的指标入库。与现有技术相比,本发明通过批量的自动加工和计算指标,然后自动落入库中提供给模型的创建,能带来数据工作上的很大便利,节省了很多的时间,简化了工作的流程。
技术领域
本发明涉及指标数据入库领域,具体提供一种批量获取样本指标和入库的方法、装置及介质。
背景技术
海量数据快速批量处理的总体过程是对海量数据任意条件抽取的大数据集进行批量更新或修改,对有大批量添加的需求,先进行大批量记录的添加,再进行批量修改,使得数据的处理和加工是以计算机大批量管理为主。这个过程是按照既定的流程智能化和自动化地完成。批量处理过程中出现的错误描述将记录在日志文件中,既不影响批量处理,又可以进行事后审计。
企业征信是指征信机构作为提供信用信息服务的企业,按一定规则合法采集企业相关信用信息,加工整理形成企业信用报告与信用评级等征信产品,有偿提供给经济活动中的贷款方、赊销方、招标方、出租方、保险方等有合法需求的信息使用者,为其了解交易对方的信用状况提供便利。但是人行征信报告没有推出信用指标体系与信用分,银行在应用纯线上信贷过程中,需要自己提取指标、进行指标加工,也需要自己构建模型,实现风控流程的自动化。
为了保证模型构建的稳定性,选取样本的数量可能很大,如何快速的选取样本指标入库是本领域技术人员亟待解决的问题。
发明内容
本发明是针对上述现有技术的不足,提供一种实用性强的批量获取样本指标和入库的方法。
本发明进一步的技术任务是提供一种设计合理,安全适用的批量获取样本指标和入库装置。
本发明进一步的技术任务是提供一种计算机可读介质。
本发明解决其技术问题所采用的技术方案是:
一种批量获取样本指标和入库的方法,具有如下步骤:
S1、新建数据库连接和数据表;
S2、批量读取样本的名称;
S3、通过读取到的样本批量调用接口计算指标;
S4、将计算完成的指标入库。
进一步的,在步骤S1中,创建最终存储样本指标数据的数据库,写入新建数据库的相关配置;
在新建连接的数据库中创建存储样本指标数据的数据表,表名依据所需自行命名,创建前先检验命名的表名是否存在,若存在,则不进行创建数据表的操作;若不存在再进行建表。
进一步的,所建表依据给出的样本数据,将企业名称、社会信用代码和所有的指标名作为数据表的字段名。
进一步的,在步骤S2中,将样本文件统一转化为csv格式的文件,编码格式为UTF-8,通过csv文件的路径读取到第一列的所有样本企业名和第二列的所有样本社会信用代码。
进一步的,依据样本数据的不同读取到不同的数据,通过样本文件得到的数据都是唯一的关联字段,所为入参调用相关的指标接口。
进一步的,在步骤S3中,通过得到的样本企业名和样本社会信用代码作为调用指标接口的入参,多次调用指标接口计算相关的样本指标,将每一次调用指标接口的结果解析出来,得到所需样本指标数据。
进一步的,在步骤S4中,把每一次调用结果解析出来得到的样本指标数据,依次追加到已创建的样本表里,按照指标名和已创建数据表的字段名一一对应起来,同时将调用接口的入参,最终得到所有所需样本的样本指标数据,且数据表和样本名对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天元大数据信用管理有限公司,未经天元大数据信用管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111609418.9/2.html,转载请声明来源钻瓜专利网。