[发明专利]特征宽表生成及业务处理模型的训练方法和装置在审
申请号: | 202110791247.X | 申请日: | 2021-07-13 |
公开(公告)号: | CN113535817A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 胡丁相;钟娙雩;方彦明 | 申请(专利权)人: | 浙江网商银行股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 310012 浙江省杭州市学*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 生成 业务 处理 模型 训练 方法 装置 | ||
1.一种特征宽表生成方法,包括:
基于业务数据库的元数据,确定与目标业务匹配的特征源表信息及训练样本包含的目标特征字段,所述业务数据库中存储有不同业务的业务基础数据,所述元数据用于描述所述业务基础数据的属性;
基于所述特征源表信息,构造用于创建多个特征源表的建表语句,所述多个特征源表用于记录与所述目标业务相关的不同特征字段的字段值;
基于所述特征源表信息,确定所述多个特征源表之间的关联字段;
基于所述多个特征源表之间的关联字段和所述目标特征字段,构造用于对所述多个特征源表进行拼接的拼接语句;
执行所述建表语句和所述拼接语句,以得到用于记录所述目标特征字段的字段值的特征宽表。
2.如权利要求1所述的方法,所述基于所述特征源表信息,构造用于创建多个特征源表的建表语句,包括:
基于所述特征源表信息指示的单个特征源表包含的特征字段及特征字段的属性信息以及预定的建表语句模板,构造用于创建所述单个特征源表的建表语句,所述属性信息包括字段类型及字段注释。
3.如权利要求1所述的方法,基于业务数据库的元数据,确定与目标业务匹配的特征源表信息,包括:
从所述业务数据库的元数据中,筛选与所述目标业务相关的元数据;
按照所属的业务维度对筛选出的元数据进行分组,以得到不同业务维度对应的元数据;
将单个业务维度对应的元数据,确定为所述单个业务维度对应的特征源表包含的特征字段;
基于不同业务维度对应的特征源表包含的特征字段及特征字段的属性信息,确定与目标业务匹配的特征源表信息。
4.如权利要求1所述的方法,所述基于所述特征源表信息,确定所述多个特征源表之间的关联字段,包括:
基于所述特征源表信息指示的单个特征源表包含的特征字段,确定单个特征源表的主键;
如果第一特征源表包含与第二特征源表的主键相同的字段,则将所述第二特征源表的主键确定为所述第一特征源表与所述第二特征源表之间的关联字段,其中,所述第一特征源表和所述第二特征源表为所述多个特征源表中不同的特征源表。
5.如权利要求1所述的方法,所述基于所述多个特征源表之间的关联字段和所述目标特征字段,构造用于对所述多个特征源表进行拼接的拼接语句,包括:
基于所述目标特征字段,确定单个特征源表中待拼接的特征字段;
基于所述待拼接的特征字段、所述目标特征字段以及预定的拼接语句模板,构造所述拼接语句。
6.如权利要求1至5中任一项所述的方法,所述建表语句和所述拼接语句通过以下任一种语言构造:Python、Mars和SQL。
7.一种业务处理模型的训练方法,包括:
获取与待处理的目标业务对应的特征宽表,所述特征宽表是通过执行用于创建多个特征源表的建表语句和用于对所述多个特征源表进行拼接的拼接语句得到的,所述多个特征源表用于记录与所述目标业务相关的不同特征字段的字段值,所述特征宽表用于记录与所述目标业务匹配的训练样本包含的目标特征字段的字段值;
查询所述特征宽表,以得到与所述目标业务匹配的训练样本;
基于所述训练样本和所述训练样本对应的标签,训练与所述目标业务对应的业务处理模型,其中,所述标签为所述训练样本在所述目标业务对应的业务处理结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江网商银行股份有限公司,未经浙江网商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110791247.X/1.html,转载请声明来源钻瓜专利网。