[发明专利]一种特征因果仓库管理方法及系统有效
| 申请号: | 202211053639.7 | 申请日: | 2022-08-31 |
| 公开(公告)号: | CN115470304B | 公开(公告)日: | 2023-08-25 |
| 发明(设计)人: | 何刚;杨健;方磊 | 申请(专利权)人: | 北京九章云极科技有限公司 |
| 主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/25;G06F16/22;G06F16/332;G06F16/36;G06N20/00 |
| 代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 刘倩兰 |
| 地址: | 100083 北京市海淀区王*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 特征 因果 仓库 管理 方法 系统 | ||
本发明实施例提供一种特征因果仓库管理方法及系统。所述方法包括:获得待处理的特征数据;基于因果发现算法对所述待处理的特征数据进行因果分析,得到所述待处理的特征数据的因果关系;基于所述因果关系构建特征因果仓库。本发明实施例基于因果发现算法对所述特征数据进行因果发现,得到所述特征数据的因果关系;基于所述因果关系构建特征因果仓库,从而实现自动构建特征因果仓库,提高了特征因果仓库的构建效率,且特征因果仓库可以增强特征数据在建模领域的可解释性、可靠性以及适用性。
技术领域
本发明涉及大数据分析领域,尤其涉及一种特征因果仓库管理方法及系统。
背景技术
随着人工智能AI和大数据的快速发展,特征数据已经成为一个发展AI技术的企业的主要AI数据资产之一。AI应用场景依赖于特征的加工,现有技术中通常是使用数据集或者数据库管理特征数据,在构建具体模型时,可以直接从数据集或者数据库中获取丰富的特征属性加入到模型中,以降低建模的数据加工耗时,加速AI场景的构建并赋能业务领域。目前构建数据集或者数据库的方式依靠人工构建,以算法人员、数据分析师的经验和业务理解为基础,通过ETL(抽取、转换、加载)的技术手段构建数据集或者数据库。人工构建数据集或者数据库成本高,需要消耗大量人力。另外,后续将构建数据集或者数据库应用于具体建模的特征数据,需要专业人员从大量的数据集或数据库表中人工筛选,特征筛选与加工中耗时长,并且强依赖于专人员的专业性,人工构建的数据集或者数据库可解释性差,利用率低。
发明内容
本发明实施例提供一种特征因果仓库管理方法及系统,解决现有技术人工构建数据集或者数据库成本高,需要消耗大量人力,且人工构建的数据集或者数据库可解释性差,利用率低。
为解决上述技术问题,本发明提供一种特征因果仓库管理方法,所述方法包括:
获得待处理的特征数据;
基于因果发现算法对所述待处理的特征数据进行因果分析,得到所述待处理的特征数据的因果关系;
基于所述因果关系构建特征因果仓库。
可选的,上述方法中,所述获得待处理的特征数据的步骤包括:
获取用户设置的业务场景及对应的数据范围;
基于所述业务场景及数据范围从数据库中获得与所述业务场景对应的特征数据。
可选的,上述方法中,所述基于因果发现算法对所述待处理的特征数据进行因果分析,得到所述待处理的特征数据的因果关系的步骤之前,所述方法还包括:
基于所述待处理的特征数据的属性,确定因果发现算法。
可选的,上述方法中,所述特征数据的属性包括特征数据的数量,所述基于所述待处理的特征数据的属性确定因果发现算法的步骤包括:
获得所述待处理的特征数据的特征数量;
根据所述待处理的特征数据的特征数量,确定因果发现算法。
可选的,上述方法中,所述基于因果发现算法对所述待处理的特征数据进行因果分析,得到所述待处理的特征数据的因果关系的步骤包括:
基于因果发现算法,得到所述待处理的特征数据对应的特征对;
根据所述待处理的特征数据对应的特征对,得到所述待处理的特征数据对应的因果关系。
可选的,上述方法中,所述基于因果发现算法,得到所述待处理的特征数据对应的特征对的步骤包括:
根据因果发现算法得到所述待处理的特征数据的特征因果顺序和特征邻接矩阵;
基于所述特征数据的特征因果顺序和特征邻接矩阵,确定具有关联关系的特征对。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京九章云极科技有限公司,未经北京九章云极科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211053639.7/2.html,转载请声明来源钻瓜专利网。





