[发明专利]数据处理方法以及装置在审
| 申请号: | 202110182739.9 | 申请日: | 2021-02-10 |
| 公开(公告)号: | CN113297135A | 公开(公告)日: | 2021-08-24 |
| 发明(设计)人: | 吴兴博;胡建洪;张友东;杨成虎 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/14;G06F16/172;G06F16/18 |
| 代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 李晓庆 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据处理 方法 以及 装置 | ||
1.一种数据处理方法,包括:
接收针对目标对象的待存储数据的数据存储请求,其中,所述数据存储请求中携带有待存储数据的属性信息以及目标对象的对象标签;
基于待存储数据的属性信息确定所述待存储数据的创建时间戳和最新时间戳,并基于所述创建时间戳和所述最新时间戳确定数据分区策略,且根据所述数据分区策略创建数据分区;
确定所述每个数据分区中所述目标对象的待存储数据,且确定所述待存储数据对应的索引数据;
基于所述索引数据对应的数据分区,所述数据分区对应的目标对象以及所述目标对象的对象标签构建第一索引表,并基于所述第一索引表将每个数据分区的待存储数据进行数据存储。
2.根据权利要求1所述的数据处理方法,所述基于所述第一索引表将每个数据分区的待存储数据进行数据存储,包括:
基于所述第一索引表中的所述数据分区对应的目标对象、所述目标对象的对象标签以及所述目标对象的待存储数据的属性信息构建第二索引表;
基于所述第一索引表以及所述第二索引表获取每个数据分区的待存储数据的存储偏移位;
根据所述存储偏移位将所述待存储数据进行存储。
3.根据权利要求1或2所述的数据处理方法,还包括:
接收数据查询请求,其中,所述数据查询请求中携带有待查询数据的属性信息;
基于所述待查询数据的属性信息在所述第一索引表中确定所述待查询数据的数据分区,并基于所述数据分区在所述第一索引表中确定所述数据分区对应目标对象以及所述目标对象的对象标签;
基于所述目标对象以及所述目标对象的对象标签进行数据查询。
4.根据权利要求3所述的数据处理方法,所述基于所述目标对象以及所述目标对象的对象标签进行数据查询,包括:
基于所述目标对象以及所述目标对象的对象标签,判断所述第二索引表中是否存在与所述待查询数据的属性信息匹配的属性信息;
若是,则基于所述目标对象确定所述待查询数据的存储偏移位,并基于所述存储偏移位查询所述待查询数据。
5.根据权利要求1所述数据处理方法,所述根据所述存储偏移位将所述待存储数据进行存储之后,还包括:
将所述第一索引表按照所述每个数据分区进行合并,获得合并后的倒排索引文件,并将所述合并后的倒排索引文件进行存储;以及
将所述第二索引表按照所述每个数据分区进行合并,获得合并后的正排索引文件,并将所述合并后的正排索引文件进行存储。
6.根据权利要求1或5所述的数据存储方法,所述基于待存储数据的属性信息确定所述待存储数据的创建时间戳和最新时间戳,包括:
基于所述待存储数据的属性信息获取所述待存储数据的创建时间戳和最新时间戳,并将所述创建时间戳和所述最新时间戳写入日志文件进行存储。
7.根据权利要求6所述的数据存储方法,所述基于所述第一索引表将每个数据分区的待存储数据进行数据存储,包括:
基于所述待存储数据的最新的时间戳以及所述数据分区策略创建新的数据分区;
根据所述新的数据分区更新所述新的数据分区对应的第一索引表,并基于所述第一索引表将所述新的数据分区的待存储数据进行存储。
8.根据权利要求2所述的数据存储方法,所述基于所述第一索引表将每个数据分区的待存储数据进行数据存储之后,还包括:
基于预设需求将所述数据分区的待存储数据进行删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110182739.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法以及装置
- 下一篇:一种高速低损耗轴承套圈下料装置





