[发明专利]网络平台基础数据质量算法的保障方法有效

专利信息
申请号: 201711276927.8 申请日: 2017-12-06
公开(公告)号: CN108170589B 公开(公告)日: 2021-08-13
发明(设计)人: 吴洋;朱兴;彭更红;王小冬;陈凌宇;杨宇 申请(专利权)人: 口碑(上海)信息技术有限公司
主分类号: G06F11/36 分类号: G06F11/36;G06F11/34
代理公司: 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 代理人: 冯德魁;窦晓慧
地址: 200135 上海市浦东新区自由*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请公开网络平台基础数据质量算法的保障方法,利用样本数据,从基础数据中提取多个已标注数据作为样本数据;利用样本数据对被测试算法进行线下算法回归评估;再通过基础数据中积累的样本数据,对被测试算法进行线上算法回归评估;通过被测试算法进行线上和线下测试的同时,对算法产生反馈,推进算法迭代,并在修正结束继续对算法进行同步的验证;不仅对算法的效果进行了可靠度量,还对算法的迭代起到作用,从而保证了基础数据的质量。
搜索关键词: 网络 平台 基础 数据 质量 算法 保障 方法
【主权项】:
1.网络平台基础数据质量算法的保障方法,其特征在于,包括:

从所述基础数据中提取多个已标注数据作为样本数据;

当被测试算法在线下时,根据所述被测试算法的要求,使用所述样本数据对所述被测试算法进行线下算法回归评估;若所述评估结果为通过,则进入下一步;若所述评估结果为不通过,则对所述被测试算法进行改进,并重新进行评估;

当所述算法上线后,在满足预定条件时,采用积累的样本数据,对所述在线被测试算法进行例行化算法回归评估;若所述评估结果为通过,则进入下一步;若评估结果为不通过,则对所述被测试算法进行在线改进,并重新进行评估。

2.根据权利要求1所述的网络平台基础数据质量算法的保障方法,其特征在于,所述对所述被测试算法进行算法回归评估,具体包括:

根据所述被测试算法的要求,使用所述样本数据,构造所述被测试算法的输入参数;

将所述输入参数提供给所述被测试算法,并获得对应的输出结果;

将所述输出结果与所述样本数据提供的对应数据相比较,获得其比较结果;

根据各次比较结果,获得所述算法回归评估的评估指标;

将所述评估指标与预定的合格指标比较,获得是否通过的所述评估结果。

3.根据权利要求1所述的网络平台基础数据质量算法的保障方法,其特征在于,所述线下算法回归评估的评估结果为通过,则所述进入下一步中,所述下一步为线下数据透视步骤,具体为以下步骤:

根据所述被测试算法对应的算法场景,使用所述基础数据中的多个已知数据,构造对应的所述被测试算法的输入数据,并获得相应的输出数据;

根据所述输出数据选择对应角度提取所述输出数据中的集合的特征值,并将所述输出数据的集合的特征值与预设的特征指标进行比较;

若差别在预定的阈值范围内,则继续进入下一步;若差别超出预定的阈值范围,则对所述被测试算法进行改进,并返回进行线下算法回归评估的步骤。

4.根据权利要求1所述的网络平台基础数据质量算法的保障方法,其特征在于,所述线下算法回归评估的评估结果为通过,则所述进入下一步中,其中,所述下一步为抽样检测,具体为以下步骤:

根据所述被测试算法的要求,在所述基础数据中选择出至少一个输入参数提供给所述被测试算法进行计算;

将上一步骤计算所获得的输出结果与所述基础数据中已经获得的对应数据进行比较,获得对应的比较结果;

根据所获得的各个输出结果的比较结果,获得统计结果;若所述统计结果满足预定的抽检评估指标,则检测的结果为通过,进入下一步;若所述统计结果未满足预定的抽检评估指标,则对所述被测试算法进行改进,并重新进行线下算法回归评估。

5.根据权利要求1所述的网络平台基础数据质量算法的保障方法,其特征在于,所述对所述在线被测试算法进行例行化算法回归评估,具体包括:

根据所述被测试算法的要求,使用所述积累的样本数据,构造所述被测试算法的输入参数;

将所述输入参数提供给所述被测试算法,并获得对应的输出结果;

将所述输出结果与所述积累的样本数据提供的对应参数相比较,获得其比较结果;

根据各次比较结果,获得所述算法回归评估的评估指标;

将所述评估指标与预定的合格指标比较,获得是否通过的评估结果。

6.根据权利要求1所述的网络平台基础数据质量算法的保障方法,其特征在于,所述线上算法回归评估的评估结果为通过,则所述进入下一步,所述下一步为数据业务监控,具体为以下步骤:

根据所述被测试算法的要求,获取所述被测试算法输出的输出数据;

通过预先设定的指标,对所述输出数据及其对应的业务进行监控,并获得对应的监控结果;

根据所获得的各个输出数据的监控结果,获得统计结果;

若所述统计结果达到预定的监控评估阈值,则所述统计结果为合格,继续进入下一步;若所述统计结果未达到预定的监控评估阈值,则所述统计结果为不合格,生成对应的预警提示,并对所述被测试算法进行改进,重新进行线下算法回归评估。

7.根据权利要求1所述的网络平台基础数据质量算法的保障方法,其特征在于,所述线上算法回归评估的评估结果为通过,则所述进入下一步,所述下一步为线上数据透视,具体为以下步骤:

根据所述被测试算法的要求,使用所述基础数据中的积累的多个已知数据,构造对应的所述被测试算法的输入数据,并获得相应的输出数据;

根据与输出数据对应的算法场景选择对应角度提取所述输出数据的集合的特征值,并将所述输出数据的集合的特征值与预设的特征指标进行比较;

若差别在预定的阈值范围内,则继续进入下一步;若差别超出预定的阈值范围,则对所述被测试算法进行改进,并返回进行线下算法回归评估的步骤。

8.一种网络平台基础数据质量算法的保障装置,其特征在于,包括:

样本数据获取单元,用于从所述基础数据中提取多个已标注数据作为样本数据;

线下算法回归评估单元,用于当被测试算法在线下时,根据所述被测试算法的要求,使用所述样本数据对所述被测试算法进行线下算法回归评估;若所述评估结果为通过,则进入下一步;若所述评估结果为不通过,则对所述被测试算法进行改进,并重新进行评估;

线上算法回归评估单元,用于当所述算法上线后,在满足预定条件时,采用积累的样本数据,对所述在线被测试算法进行例行化算法回归评估;若评估结果为不通过,则对所述被测试算法进行在线改进,并重新进行评估。

9.根据权利要求8所述的网络平台基础数据质量算法的保障装置,其特征在于,包括:线下数据透视单元,用于根据所述被测试算法的要求,对所述被测试算法的输出数据进行数据透视,所述线下数据透视单元包括:

第一数据采集单元,用于根据所述被测试算法对应的算法场景,使用所述基础数据中的多个已知数据,构造对应的所述被测试算法的输入数据,并获得相应的输出数据;

线下数据特征值处理单元,用于根据所述输出数据选择对应角度提取所述输出数据中的集合的特征值;并将所述输出数据的集合的特征值与预设的特征指标进行比较;

线下数据透视执行单元,若差别在预定的阈值范围内,则继续进入下一步;若差别超出预定的阈值范围,则对所述被测试算法进行改进,并返回进行线下算法回归评估的步骤。

10.根据权利要求8所述的网络平台基础数据质量算法的保障装置,其特征在于,包括:抽样检测单元,用于根据所述被测试算法的要求,对所述被测试算法的输出数据进行抽样检测,所述抽样检测单元包括:

抽样检测参数选取单元,用于根据所述被测试算法的要求,在所述基础数

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口碑(上海)信息技术有限公司,未经口碑(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711276927.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top