[发明专利]数据处理方法、装置、电子设备及存储介质在审
| 申请号: | 202110191245.7 | 申请日: | 2021-02-19 |
| 公开(公告)号: | CN113780324A | 公开(公告)日: | 2021-12-10 |
| 发明(设计)人: | 祖辰;杨立军 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/00 |
| 代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
| 地址: | 100176 北京市大兴区北京经济*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种数据处理方法、装置、电子设备及存储介质。该方法包括:获取高维数据、待选取特征数量、第一目标权重矩阵和第二目标权重矩阵,所述高维数据包括多个特征;从所述高维数据中选取第一特征子集,所述第一特征子集包括所述待选取特征数量个特征;根据所述高维数据、所述第一特征子集、第一目标权重矩阵和所述第二目标权重矩阵,确定所述高维数据中各个特征的得分;根据所述高维数据中各个特征的得分,从所述高维数据中选取第二特征子集,所述第二特征子集包括所述待选取特征数量个特征;将所述第二特征子集确定为目标特征子集。该方法可以该方法可以提高数据处理的准确率,节约计算机资源,提高数据处理效率。
技术领域
本公开涉及计算机技术领域,尤其涉及一种数据处理方法、装置、电子设备及存储介质。
背景技术
在对高维数据进行分类时,因高数数据中具有大量并不相关且冗余的特征,会导致非常高的计算成本,并且降低分类正确率或者聚类准确率等任务的性能。
相关技术中,以暴力计算方式计算每个特征子集的得分,通常需要付出高额的计算成本;将单个高维数据作为向量,即通过连续地将其所有行或者列向量串联起来,将高维数据转换为一个长向量,会因为样本矩阵的维度将远远大于样本个数而陷入维数灾难,增加算法的时间和空间成本,计算资源耗费巨大且处理效率较低。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种数据处理方法、装置、电子设备及存储介质,该方法可以提高数据处理的准确率,节约计算机资源,提高数据处理效率。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
本公开实施例提供一种数据处理方法,包括:获取高维数据、待选取特征数量、第一目标权重矩阵和第二目标权重矩阵,所述高维数据包括多个特征;从所述高维数据中选取第一特征子集,所述第一特征子集包括所述待选取特征数量个特征;根据所述高维数据、所述第一特征子集、第一目标权重矩阵和所述第二目标权重矩阵,确定所述高维数据中各个特征的得分;根据所述高维数据中各个特征的得分,从所述高维数据中选取第二特征子集,所述第二特征子集包括所述待选取特征数量个特征;将所述第二特征子集确定为目标特征子集。
在本公开一些示例性实施例中,将所述第二特征子集确定为目标特征子集,包括:根据所述高维数据、所述第二特征子集、所述第一目标权重矩阵和所述第二目标权重矩阵,重新确定所述高维数据中各个特征的得分;根据重新确定的所述高维数据中各个特征的得分,从所述高维数据中选取第三特征子集,所述第三特征子集包括所述待选取特征数量个特征;将所述第三特征子集确定为所述目标特征子集。
在本公开一些示例性实施例中,根据所述高维数据、所述第一特征子集、第一目标权重矩阵和所述第二目标权重矩阵,确定所述高维数据中各个特征的得分,包括:根据所述高维数据和所述第一特征子集,确定第一特征选择矩阵;根据所述第一目标权重矩阵、所述第二目标权重矩阵和所述第一特征选择矩阵,确定所述第一特征子集的得分:根据所述第一特征选择矩阵,确定所述高维数据中各个特征对应的特征选择向量;根据所述第一目标权重矩阵、所述第二目标权重矩阵、所述高维数据中各个特征对应的特征选择向量和所述第一特征子集的得分,确定所述高维数据中各个特征的得分。
在本公开一些示例性实施例中,根据所述第一目标权重矩阵、所述第二目标权重矩阵和所述第一特征选择矩阵,确定所述第一特征子集的得分,包括:根据所述第一目标权重矩阵和所述第一特征选择矩阵,确定第一评分矩阵;根据所述第二目标权重矩阵和所述第二特征选择矩阵,确定第二评分矩阵;将所述第一评分矩阵的迹和所述第二评分矩阵的迹的比值确定为所述第一特征子集的得分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司,未经北京沃东天骏信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110191245.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据校验的方法和装置
- 下一篇:一种电液多执行器流量控制系统及方法





