[发明专利]一种模型迁移的特征值确定方法、装置及设备有效
| 申请号: | 202010312789.X | 申请日: | 2020-04-20 |
| 公开(公告)号: | CN111523995B | 公开(公告)日: | 2023-03-17 |
| 发明(设计)人: | 阮怀玉;章鹏;苏煜 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06F16/21;G06F16/2455;G06F18/24 |
| 代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 模型 迁移 特征值 确定 方法 装置 设备 | ||
本说明书实施例公开了一种基于模型迁移的特征值确定方法、装置以及设备,方案包括:获取源场景数据集的基于第一特征维度的第一数据分箱的数据在所述源场景数据集中的占比信息;在目标场景数据集中基于所述第一特征维度确定与所述占比信息相匹配的第二数据分箱;获取所述第一数据分箱的数据在第二特征维度的特征值;将所述特征值确定为所述第二数据分箱的数据在所述第二特征维度的特征值。
技术领域
本申请涉及数据风险防控技术领域,尤其涉及一种模型迁移的特征值确 定方法、装置及设备。
背景技术
随着信息技术的不断发展,越来越多的行为可以通过网络实现。在通过 网络实现这些行为的过程中,会产生大量的数据(简称大数据)。于是,通 过对大数据进行分析,可以识别出某些数据所对应的行为是否是异常行为, 进而存在风险。例如,当某个非企业账户每天产生大量的交易数据时,该账 户就可能有违规经营或者洗钱等风险。
为了尽可能的通过对于数据的分析,识别出潜在的风险,利用历史数据 构建的数据驱动的风险防控模型,应运而生。但是,若在一个新开展的业务 场景中进行风险防控,由于缺乏历史数据,无法对模型进行训练等原因,导 致在初始阶段构建风控模型存在较大困难。
综上,如何能够在历史数据不够充足的情况下,对于数据风险进行防控, 仍是亟待解决的问题。
发明内容
本说明书实施例提供一种基于模型迁移的特征值确定方法、装置及设备, 以解决历史数据不够充足的情况下,对于数据风险进行防控的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种基于模型迁移的特征值确定方法,包括:
获取源场景数据集的基于第一特征维度的第一数据分箱的数据在所述源 场景数据集中的占比信息;
在目标场景数据集中基于所述第一特征维度确定与所述占比信息相匹配 的第二数据分箱;
获取所述第一数据分箱的数据在第二特征维度的特征值;
将所述特征值确定为所述第二数据分箱的数据在所述第二特征维度的特 征值。
本说明书实施例提供的一种基于模型迁移的特征值确定装置,包括:
占比信息获取模块,用于获取源场景数据集的基于第一特征维度的第一 数据分箱的数据在所述源场景数据集中的占比信息;
占比匹配模块,用于在目标场景数据集中基于所述第一特征维度确定与 所述占比信息相匹配的第二数据分箱;
特征值获取模块,用于获取所述第一数据分箱的数据在第二特征维度的 特征值;
特征值确定模块,用于将所述特征值确定为所述第二数据分箱的数据在 所述第二特征维度的特征值。
本说明书实施例提供的一种基于模型迁移的特征值确定设备,
包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所 述至少一个处理器执行,以使所述至少一个处理器能够:
获取源场景数据集的基于第一特征维度的第一数据分箱的数据在所述源 场景数据集中的占比信息;
在目标场景数据集中基于所述第一特征维度确定与所述占比信息相匹配 的第二数据分箱;
获取所述第一数据分箱的数据在第二特征维度的特征值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010312789.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗静电剂和一种抗静电离型膜及其制备方法
- 下一篇:智能监督灯丝继电器





