[发明专利]面向用户自定义元数据的索引与查询方法和系统有效
| 申请号: | 202010259594.3 | 申请日: | 2020-04-03 |
| 公开(公告)号: | CN111427847B | 公开(公告)日: | 2023-04-11 |
| 发明(设计)人: | 卢宇彤;杜云飞;陈志广 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/14 |
| 代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 谭武艺 |
| 地址: | 510275 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 用户 自定义 数据 索引 查询 方法 系统 | ||
1.一种面向用户自定义元数据的索引方法,其特征在于实施步骤包括:
1)获取自描述文件的用户自定义元数据,包括“属性名”、“属性值”和“数据对象路径”;
2)初始化包含值存储哈希表ValueStore、路径存储哈希表PathStore的层次式哈希索引结构并填充用户自定义元数据,所述值存储哈希表ValueStore的键存储“属性名”、值存储该“属性名”对应的“属性值”集合;所述路径存储哈希表PathStore的键存储“属性名”和某一“属性值”组成的字符串,值存储该“属性名”及“属性值”对应“数据对象路径”集合;
3)将层次式哈希索引结构持久化存储;
还包括处理类型为范围查询的用户查询请求:
A1)获取用户查询请求中指定的目标“属性名”;
A2)根据目标“属性名”查询值存储哈希表ValueStore得到目标“属性名”对应的所有“属性值”集合,其中值存储哈希表ValueStore中存储的被查询数据的键为“属性名”、值为该“属性名”对应的所有“属性值”集合;其次,根据查询请求中指定的“属性值”范围筛选满足查询条件的“属性值”;
A3)针对目标“属性名”对应的所有筛选后的“属性值”:将目标“属性名”、该“属性值”组合为新的字符串,根据新的字符串作为键查询路径存储哈希表PathStore得到该“属性值”对应的“数据对象路径”集合,其中路径存储哈希表PathStore中存储的被查询数据的键为“属性名”和某一“属性值”组成的字符串,值为该“属性名”及“属性值”对应的“数据对象路径”集合;
A4)将每一个“属性值”查询得到的“数据对象路径”集合组合后作为查询结果返回。
2.根据权利要求1所述的面向用户自定义元数据的索引方法,其特征在于,步骤1)之前还包括根据自描述文件生成元数据信息的步骤:搜索指定路径,收集所有自描述文件的路径信息并加入共享任务队列;启动多个元数据提取进程,为每个元数据提取进程分发任务,每个元数据提取进程独立从共享任务队列中获取待处理的自描述文件的路径,遍历该自描述文件的内部数据集并提取用户自定义元数据信息,所述用户自定义元数据信息包括属性名、属性值和数据对象路径;汇总所有进程提取的用户自定义元数据信息。
3.根据权利要求1所述的面向用户自定义元数据的索引方法,其特征在于,步骤3)中将层次式哈希索引结构持久化存储具体是指将层次式哈希索引结构写入文件系统的索引文件。
4.根据权利要求1所述的面向用户自定义元数据的索引方法,其特征在于,步骤3)之后还包括加载写入文件系统中的索引文件重构层次式哈希索引结构的步骤。
5.根据权利要求1所述的面向用户自定义元数据的索引方法,其特征在于,所述层次式哈希索引结构还包括定制哈希表CHTable,所述定制哈希表CHTable中的键分别存储值存储哈希表ValueStore的“属性值”集合中的元素、路径存储哈希表PathStore的“数据对象路径”集合的元素,且对应的值均为空。
6.根据权利要求1所述 的面向用户自定义元数据的索引方法,其特征在于,还包括处理类型为非范围查询的用户查询请求:
B1)获取用户查询请求中指定的目标“属性名”和目标“属性值”;
B2)将目标“属性名”和目标“属性值”组合为新的字符串,根据新的字符串作为键查询路径存储哈希表PathStore得到该键对应的“数据对象路径”集合,其中路径存储哈希表PathStore中存储的被查询数据的键为“属性名”和某一“属性值”组成的字符串,值为该“属性名”及“属性值”对应的“数据对象路径”集合,并将得到的“数据对象路径”集合作为查询结果返回。
7.一种面向用户自定义元数据的查询系统,包括计算机设备,其特征在于,该计算机设备被编程或配置以执行权利要求1~6中任意一项所述面向用户自定义元数据的索引方法的步骤,或者该计算机的存储器上存储有设备被编程或配置以执行权利要求1~6中任意一项所述面向用户自定义元数据的索引方法的计算机程序。
8.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有设备被编程或配置以执行权利要求1~6中任意一项所述面向用户自定义元数据的索引方法的计算机程序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010259594.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





