[发明专利]数据处理方法及装置有效
| 申请号: | 201710386802.4 | 申请日: | 2017-05-26 |
| 公开(公告)号: | CN108932268B | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 刘洋;车文彬;张旭 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2458 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 罗振安 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本申请公开了一种数据处理方法及装置,属于大数据技术领域。所述方法包括:分别获取属于样本数据表的样本列字段与属于至少一个基准数据表的n个基准列字段中的每个基准列字段的相似度集合;根据获取到的n个相似度集合以及每个相似度的预设权重,确定样本列字段对应的初始基准列字段;获取用于指示:样本列字段与初始基准列字段的对应关系的准确度的准确度标签;根据准确度标签和获取到的n个相似度集合,确定每个相似度的目标权重;根据获取到的n个相似度集合以及每个相似度的目标权重,确定样本列字段对应的目标基准列字段。本申请解决了数据处理的效率较低的问题,提高了数据处理的效率,本申请用于数据的处理。 | ||
| 搜索关键词: | 数据处理 方法 装置 | ||
【主权项】:
1.一种数据处理方法,其特征在于,所述方法包括:分别获取属于样本数据表的样本列字段与属于至少一个基准数据表的n个基准列字段中的每个基准列字段的相似度集合,第i个所述相似度集合包括:所述样本列字段的特征集与所述n个基准列字段中的第i个基准列字段的特征集的相似度,所述n≥i≥1;根据获取到的n个相似度集合以及每个所述相似度的预设权重,确定所述样本列字段在所述n个基准列字段中对应的初始基准列字段;获取准确度标签,所述准确度标签用于指示:所述样本列字段与所述初始基准列字段的对应关系的准确度;根据所述准确度标签和获取到的n个相似度集合,确定每个所述相似度的目标权重;根据获取到的n个相似度集合以及每个所述相似度的目标权重,确定所述样本列字段在所述n个基准列字段中对应的目标基准列字段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710386802.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据迁移方法及系统
- 下一篇:烹饪的方法、装置以及系统





