[发明专利]多表拼接方法、装置、电子设备及存储介质在审
| 申请号: | 202110667383.8 | 申请日: | 2021-06-16 |
| 公开(公告)号: | CN113312890A | 公开(公告)日: | 2021-08-27 |
| 发明(设计)人: | 周浩;罗远飞;涂威威 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
| 主分类号: | G06F40/18 | 分类号: | G06F40/18 |
| 代理公司: | 北京墨丘知识产权代理事务所(普通合伙) 11878 | 代理人: | 代峰;谷轶楠 |
| 地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 拼接 方法 装置 电子设备 存储 介质 | ||
1.一种多表拼接方法,其特征在于,包括:
基于关系数据表集合构建本体视图;其中,所述关系数据表集合包括一个主数据表和至少一个副数据表,所述本体视图中的每个节点代表一个数据表,所述本体视图中两个节点之间的关系边代表对应两个数据表之间的关系;
基于所述本体视图,获取每个副数据表节点到主数据表节点的元路径;其中,每条元路径中的相邻两个节点之间的连接关系包括对应两个数据表之间的关系和拼表操作符;
基于每个元路径,将对应副数据表中的特征数据拼接到主数据表中;其中,每个元路径中的中间节点只充当传递节点,其对应数据表的特征数据不通过该元路径传递到主数据表。
2.根据权利要求1所述的方法,其中,所述获取每个副数据表节点到主数据表节点的元路径包括:
对于所述至少一个副数据表中的每个副数据表,在本体视图中随机选取对应副数据表节点到达主数据表节点的路径,或者在本体视图中选取对应副数据表节点到达主数据表节点的最短路径,或者在本体视图中按用户配置条件选取对应副数据表节点到达主数据表节点的路径,将选取结果作为所述元路径。
3.根据权利要求1或2所述的方法,其中,所述方法还包括:
在完成所述拼接之后,基于所述主数据表进行模型训练;
使用训练后的模型对所述关系数据表集合对应的至少一个服务进行预测。
4.根据权利要求1所述的方法,其特征在于,所述拼表操作符与所述相邻两个节点中尾端节点的数据表连接键值相对应。
5.根据权利要求4所述的方法,其特征在于,所述拼表操作符包括:
在所述尾端节点的数据表连接键值是唯一值时,对应的所述拼表操作符为直接拼表操作符;或者,
在所述尾端节点的数据表连接键值是非唯一值时,对应的所述拼表操作符为聚合拼表操作符。
6.根据权利要求5所述的方法,其特征在于,所述聚合拼表操作符包括:最大化连接拼表操作符和/或最小化连接拼表操作符。
7.一种多表拼接装置,其特征在于,包括:
本体视图构建模块,用于基于关系数据表集合构建本体视图;其中,所述关系数据表集合包括一个主数据表和至少一个副数据表,所述本体视图中的每个节点代表一个数据表,所述本体视图中两个节点之间的关系边代表对应两个数据表之间的关系;
元路径获取模块,用于基于所述本体视图,获取每个副数据表节点到主数据表节点的元路径;其中,每条元路径中的相邻两个节点之间的连接关系包括对应两个数据表之间的关系和拼表操作符;
表拼接模块,用于基于每个元路径,将对应副数据表中的特征数据拼接到主数据表中;其中,每个元路径中的中间节点只充当传递节点,其对应数据表的特征数据不通过该元路径传递到主数据表。
8.根据权利要求7所述的装置,其中,对于所述至少一个副数据表中的每个副数据表,所述元路径获取模块包括:
随机选取模块,用于在本体视图中随机选取对应副数据表节点到达主数据表节点的路径;
或者,最短路径选取模块,用于在本体视图中选取对应副数据表节点到达主数据表节点的最短路径;
或者,条件选取模块,用于在本体视图中按用户配置条件选取对应副数据表节点到达主数据表节点的路径。
9.一种电子设备,其特征在于,包括:
存储器以及一个或多个处理器;
其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如权利要求1-6任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如权利要求1-6任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110667383.8/1.html,转载请声明来源钻瓜专利网。





