首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于数据拼接的模型训练方法、装置、系统和记录介质在审

申请号：	201910330935.9	申请日：	2019-04-23
公开（公告）号：	CN110135467A	公开（公告）日：	2019-08-16
发明（设计）人：	姜润洲;苏绥绥;常富洋	申请（专利权）人：	北京淇瑀信息科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62;G06Q40/02
代理公司：	北京清诚知识产权代理有限公司 11691	代理人：	乔东峰
地址：	100012 北京市朝阳***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	标签数据分箱评分模型数据拼接用户数据模型训练信贷计算机可读介质模型准确性人工工作量离线模拟模拟结果自动地拼接标签
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于数据拼接的模型训练方法，包括如下步骤：

获取用户数据，所述用户数据由多个标签数据构成，所述标签数据包括标签名及标签值；

根据所述用户数据的至少一个标签数据进行分箱，获得分箱标签数据；

将所述分箱标签数据与未分箱的其他标签数据进行拼接后输入信贷评分模型进行训练；

对训练后的所述信贷评分模型进行离线模拟，根据模拟结果对标签数据进行调整。

2.如权利要求1所述的基于数据拼接的模型训练方法，其特征在于：所述用户数据，包括在线产生的数据、预先生成并存储的数据、通过输入装置或传输媒介而从外部接收的数据中的至少一种。

3.如权利要求1所述的基于数据拼接的模型训练方法，其特征在于：在根据所述用户数据的至少一个标签数据进行分箱，获得分箱标签数据之前，还包括对用户数据的清洗。

4.如权利要求3所述的基于数据拼接的模型训练方法，其特征在于：所述清洗过程包括：缺失值分析处理、单变量异常分析。

5.如权利要求1所述的基于数据拼接的模型训练方法，其特征在于：所述分箱步骤为：根据预定的规则对标签数据进行自动分箱。

6.如权利要求1所述的基于数据拼接的模型训练方法，其特征在于：所述信贷评分模型为xgboost模型。

7.如权利要求1所述的基于数据拼接的模型训练方法，其特征在于：所述对标签数据进行调整的步骤包括：根据标签对信贷评分的影响程度进行排序，将影响程度低于预设阈值的标签数据从所述用户数据中进行剔除。

8.一种基于数据拼接的模型训练装置，包括：

数据获取模块，用于获取用户数据，所述用户数据由多个标签数据构成，所述标签数据包括标签名及标签值；

数据分箱模块，用于根据所述用户数据的至少一个标签数据进行分箱，获得分箱标签数据；

数据拼接模块，用于将所述分箱标签数据与未分箱的其他标签数据进行拼接后输入信贷评分模型；

信贷评分模块，用于接收所述数据拼接模块输出的数据，并利用信贷评分模型进行评分计算，获得用户信贷评分；

训练模块，用于根据所述用户信贷评分对所述信贷评分模型进行训练；

离线模拟模块，用于对训练后的信贷评分模型进行离线模拟，获得模拟结果。

9.一种基于数据拼接的模型训练系统，其特征在于，包括：

存储器，用于存储计算机可执行程序；

数据处理装置，用于读取所述存储器中的计算机可执行程序，以执行权利要求1至7中任一项所述的基于数据拼接的模型训练方法。

10.一种计算机可读介质，用于存储计算机可读程序，其特征在于，所述计算机可读程序用于执行权利要求1至7中任一项所述的基于数据拼接的模型训练方法。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京淇瑀信息科技有限公司，未经北京淇瑀信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910330935.9/1.html，转载请声明来源钻瓜专利网。

上一篇：一种污染物排放超标车辆判断方法及系统
下一篇：一种煤矸石的识别方法

同类专利

专利分类

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top