[发明专利]一种数据分析的方法和装置在审
| 申请号: | 201710266253.7 | 申请日: | 2017-04-21 |
| 公开(公告)号: | CN108733714A | 公开(公告)日: | 2018-11-02 |
| 发明(设计)人: | 王丹;徐峰;李文科;韩贞阳 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;姜劲 |
| 地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型识别 评估结果 重用 样本 方法和装置 交集 数据分析 样本数据 原始数据 增量评估 增量样本 工作效率 评估过程 数量确定 自适应 抽取 过滤 消耗 评估 分析 | ||
1.一种数据分析的方法,其特征在于,包括:
根据过滤函数从所述原始数据中确定出所述第一模型识别结果与所述第二模型识别结果,然后确定出所述第一模型识别结果与所述第二模型识别结果的交集;
根据所述交集以及抽取的样本数量确定出自适应样本数量;
根据所述自适应样本数量从所述第一模型识别结果中确定出重用样本数据和所述重用样本数据所对应的重用评估结果,以及从所述第二模型识别结果中确定出增量样本数据;
对所述增量样本数据进行评估,以确定出增量评估结果,并以所述重用评估结果和所述增量评估结果为最终评估结果对所述原始数据进行分析。
2.根据权利要求1所述的方法,其特征在于,根据所述交集以及抽取的样本数量确定出自适应样本数量,包括:
其中,A表示原始数据的集合,x1表示第一模型的分析条件,x2表示第二模型的分析条件,n1表示从第一模型识别结果抽取的样本数量,n2表示从第二模型识别结果抽取的样本数量,p(A,x1)表示按照x1的分析条件对集合A进行过滤得到的第一模型识别结果的集合,p(A,x2)表示按照x2的分析条件对集合A进行过滤得到的第二模型识别结果的集合,p(A,x1)∩p(A,x2)表示集合p(A,x1)与集合p(A,x2)的交集中的元素的个数。
3.根据权利要求1所述的方法,其特征在于,
在根据所述自适应样本数量从所述第一模型识别结果中确定出重用样本数据和所述重用样本数据所对应的重用评估结果,以及从所述第二模型识别结果中确定出增量样本数据的步骤之前,还包括:根据抽样函数从所述第一模型识别结果中确定出第一样本数据,以及从所述第二模型识别结果中确定出第二样本数据,其中,所述第一样本数据中包括所述重用样本数据,所述第二样本数据中包括所述增量样本数据;
并且,根据所述自适应样本数量从所述第一模型识别结果中确定出重用样本数据和所述重用样本数据所对应的重用评估结果,以及从所述第二模型识别结果中确定出增量样本数据的步骤包括:从所述第一样本数据中确定出与所述自适应样本数量相同的所述重用样本数据,从所述第一模型识别结果的评估结果中确定出所述重用评估结果;
根据所述样本数量以及所述自适应样本数量,从所述第二模型识别结果中确定出增量样本数据。
4.一种数据分析的装置,其特征在于,包括:
第一确定模块,用于根据过滤函数从所述原始数据中确定出所述第一模型识别结果与所述第二模型识别结果,然后确定出所述第一模型识别结果与所述第二模型识别结果的交集;
第二确定模块,用于根据所述交集以及抽取的样本数量确定出自适应样本数量;
第三确定模块,用于根据所述自适应样本数量从所述第一模型识别结果中确定出重用样本数据和所述重用样本数据所对应的重用评估结果,以及从所述第二模型识别结果中确定出增量样本数据;
处理模块,用于对所述增量样本数据进行评估,以确定出增量评估结果,并以所述重用评估结果和所述增量评估结果为最终评估结果对所述原始数据进行分析。
5.根据权利要求4所述的装置,其特征在于,所述第二确定模块还用于:
其中,A表示原始数据的集合,x1表示第一模型的分析条件,x2表示第二模型的分析条件,n1表示从第一模型识别结果抽取的样本数量,n2表示从第二模型识别结果抽取的样本数量,p(A,x1)表示按照x1的分析条件对集合A进行过滤得到的第一模型识别结果的集合,p(A,x2)表示按照x2的分析条件对集合A进行过滤得到的第二模型识别结果的集合,p(A,x1)∩p(A,x2)表示集合p(A,x1)与集合p(A,x2)的交集中的元素的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710266253.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据仓库中的数据查询方法及装置
- 下一篇:建筑物出入口位置的确定方法及装置





