[发明专利]对测试样本中的缺失属性值进行预测的方法及装置有效
申请号: | 201910818641.0 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110647519B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 高呈琳 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F18/22;G06F18/15;G06F18/21;G06V10/72;G06V10/776 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 魏学昊 |
地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测试 样本 中的 缺失 属性 进行 预测 方法 装置 | ||
本公开是关于一种对测试样本中的缺失属性值进行预测的方法及装置,属于测试技术领域,该方法包括:分别获取缺失测试样本目标属性以外属性的属性值的向量,并将向量按照目标属性以外属性的顺序连成第一向量串;针对每个非缺失测试样本,分别获取目标属性以外属性的属性值对应的向量,并将向量按照非缺失测试样本中目标属性以外属性的顺序连成第二向量串;计算每个第二向量串和第一向量串的欧式距离;基于符合预定条件的非缺失测试样本中的目标属性的属性值,预测测试样本中的缺失属性值;将预测到的缺失属性值作为目标属性的属性值。本公开通过缺失测试样本与非缺失测试样本的对比计算,有效保证缺失测试样本的缺失属性值获取的效率和准确性。
技术领域
本公开涉及测试技术领域,具体而言,涉及一种对测试样本中的缺失属性值进行预测的方法及装置。
背景技术
对测试样本中的缺失属性值进行预测就是用于测试目标系统运行稳定性等性能的测试样本集中的测试样本中的缺失属性值进行预测。
目前,在对目标系统进行测试时,通常准备测试样本集,通过将测试样本集中每个测试样本输入目标系统以测试目标系统的各项性能。随着目标系统的不断升级,测试样本同样会进行修改以适应升级或者改动后的目标系统。现有技术中,通常会存在用于测试目标系统的测试样本的某项属性的属性值缺失,但是无法查找到缺失哪个属性的属性值的情况,因此,存在测试样本的修改困难,目标系统的测试难以得到保障的问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种对测试样本中的缺失属性值进行预测的方案,进而至少在一定程度上通过缺失测试样本与非缺失测试样本的对比计算,有效保证缺失测试样本的缺失属性值获取的效率和准确性。
根据本公开的一个方面,提供一种对测试样本中的缺失属性值进行预测的方法,包括:
针对缺失特定的目标属性的属性值的缺失测试样本,分别获取所述缺失测试样本的所述目标属性以外的属性的属性值对应的向量,并将所述向量按照所述缺失测试样本中所述目标属性以外的属性的顺序连成第一向量串;
针对未缺失属性值的每个非缺失测试样本,分别获取所述缺失测试样本的所述目标属性以外的属性的属性值对应的向量,并将所述向量按照该非缺失测试样本中所述目标属性以外的属性的顺序连成第二向量串;
计算每个所述非缺失测试样本的所述第二向量串和所述缺失测试样本的所述第一向量串的欧式距离;
确定所述欧式距离符合预定条件的非缺失测试样本;
基于欧式距离符合预定条件的非缺失测试样本中的目标属性的属性值,预测测试样本中的缺失属性值;
将预测到的所述测试样本中的缺失属性值作为所述缺失测试样本的所述目标属性的属性值。
在本公开的一种示例性实施例中,所述确定所述欧式距离符合预定条件的非缺失测试样本,包括:
确定所述欧式距离最小的非缺失测试样本;
所述基于欧式距离符合预定条件的非缺失测试样本中的目标属性的属性值,预测测试样本中的缺失属性值,包括:
将欧式距离最小的非缺失测试样本中的目标属性的属性值,作为预测的测试样本中的缺失属性值。
在本公开的一种示例性实施例中,所述确定所述欧式距离符合预定条件的非缺失测试样本,包括:
确定所述欧式距离小于预定欧式距离阈值的非缺失测试样本;
所述基于欧式距离符合预定条件的非缺失测试样本中的目标属性的属性值,预测测试样本中的缺失属性值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910818641.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据源融合计算方法、组件及装置
- 下一篇:数据采集设备