[发明专利]基于Key-Value表的非结构化数据存储方法、装置及电子设备在审
申请号: | 202111586927.4 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114281922A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 秦晓宏;黄主斌 | 申请(专利权)人: | 上海柯林布瑞信息技术有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/81 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 赵迎迎 |
地址: | 200233 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 key value 结构 数据 存储 方法 装置 电子设备 | ||
1.一种基于Key-Value表的非结构化数据存储方法,其特征在于,包括:
获取至少一个非结构化文件;
解析所述非结构化文件,获取所述非结构化文件中的节点标识和节点数据;
基于所述非结构化文件中的节点标识和节点数据,将存在对应关系的节点标识和节点数据组合成键值对;
基于所述非结构化文件及所述非结构化文件对应的键值对,将所述键值对中的节点标识和节点数据存储至第一数据表中。
2.根据权利要求1所述的方法,其特征在于,所述第一数据表中还包括文件标识,所述文件标识与所述非结构化文件相对应,并与所述节点标识和节点数据对应存储。
3.根据权利要求1所述的方法,其特征在于,解析所述非结构化文件,还包括:获取所述非结构化文件中的节点名称,所述节点名称与所述节点标识相对应,并与所述节点标识对应存储。
4.根据权利要求3所述的方法,其特征在于,还包括字段词典,所述字段词典用于存储节点名称和节点标识,所述方法还包括:
将解析所述非结构化文件所获得的节点标识和节点名称与所述字段词典中存储的所述节点标识和节点名称相对比;
若不同,则基于解析所述非结构化文件所获得的节点标识和节点名称更新所述字段词典中存储的所述节点标识和/或节点名称。
5.根据权利要求2所述的方法,其特征在于,还包括根据所述第一数据表的数据生成第二数据表,生成过程包括:
获取所述第一数据表中的所有不同节点标识;
基于所述所有不同节点标识生成建表语句;
根据所述建表语句生成所述第二数据表的表结构;
基于所述第一数据表中的文件标识及各节点标识和节点数据的键值对,生成所述第二数据表的数据。
6.根据权利要求4所述的方法,其特征在于,还包括根据所述字段词典的数据生成第二数据表,生成过程包括:
获取所述字段词典中的所有不同节点标识;
基于所述所有不同节点标识生成建表语句;
根据所述建表语句生成所述第二数据表的表结构;
基于所述第一数据表中的文件标识及各节点标识和节点数据的键值对,生成所述第二数据表的数据。
7.根据权利要求5或6所述的方法,其特征在于,所述第二数据表还包括节点名称,所述节点名称位于所述第二数据表的表头,并与所述节点标识相对应。
8.根据权利要求1~6任一所述的方法,其特征在于,还包括标准化数据映射表,所述解析所述非结构化文件,获取所述非结构化文件中的节点标识和节点数据后,还包括:将所述节点数据通过所述标准化数据映射表的映射成为标准节点数据,存储在所述第一数据表和/或第二数据表中,替换相应的节点数据。
9.一种基于Key-Value表的非结构化数据存储装置,其特征在于,包括:
文件获取模块,用于获取至少一个非结构化文件;
文件解析模块,用于解析所述非结构化文件,获取所述非结构化文件中的节点标识和节点数据;
键值对组合模块,用于基于所述非结构化文件中的节点标识和节点数据,将存在对应关系的节点标识和节点数据组合成键值对;
键值对存储模块,用于基于所述非结构化文件及所述非结构化文件对应的键值对,将所述键值对中的节点标识和节点数据存储至第一数据表中。
10.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述程序被所述处理器执行,使得所述处理器实现如权利要求1-8中任一所述的基于Key-Value表的非结构化数据存储方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海柯林布瑞信息技术有限公司,未经上海柯林布瑞信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111586927.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防爆工业级对讲平板
- 下一篇:单晶硅体内BMD的批量评价方法