[发明专利]数据管理系统、数据管理方法及记录介质有效
申请号: | 201580083082.3 | 申请日: | 2015-10-28 |
公开(公告)号: | CN108027816B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 浜田伸一郎;小野聪一郎;汤浅真由美;长田邦男 | 申请(专利权)人: | 株式会社东芝;东芝数字解决方案株式会社 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/906 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 杨谦 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据管理 系统 方法 记录 介质 | ||
实施方式的数据管理系统具备索引构筑器(200)和检索器(300)。索引构筑器(200)生成与事例矢量类似的周边矢量,且构筑用于根据周边矢量确定事例矢量的索引信息(40),所述事例矢量是所积蓄的数据的特征矢量。检索器(300)按照指定了作为任意的特征矢量的查询矢量的检索请求,使用索引信息(40),确定与查询矢量完全一致的周边矢量所对应的事例矢量,输出基于所确定的事例矢量的检索结果数据集(60)。
技术领域
本发明的实施方式涉及数据管理系统、数据管理方法及记录介质。
背景技术
近年来,伴随信息通信技术的发展,能够进行多种多样数据的收集或积蓄、大数据分析或大媒体分析等这样的以大规模数据为对象的信息处理技术被关注。在处理这样的大规模数据的系统中,伴随数据规模的加速扩大的计算量的庞大化涉及到服务的劣化,所以如何能够削减计算量成为重要的课题。
在数据库检索等数据检索中,作为高速进行图像或音乐等媒体检索的方法,进行使用了多维的特征矢量的相似性检索。在该相似性检索中,包含特征矢量间的相似度计算的矢量附近检索、即、从成为检索对象的特征矢量(以下,将其称为“事例矢量”)群之中找出与某特征矢量(以下,将其称为“查询(query)矢量”)接近的特征矢量群的处理占据计算量的大多数。因此,希望能够削减矢量附近检索的计算量而缩短数据检索的执行时间。
发明内容
本发明要解决的课题是,提供能够削减矢量附近检索的计算量而缩短数据检索的执行时间的数据管理系统、数据管理方法及程序。
实施方式的数据管理系统具备索引构筑部和检索部。索引构筑部生成与作为所积蓄的数据的特征矢量的事例矢量类似的周边矢量,构筑用于确定与所生成的所述周边矢量对应的所述事例矢量的索引信息。检索部按照指定了作为任意的特征矢量的查询矢量的检索请求,使用所述索引信息,确定与所述查询矢量完全一致的所述周边矢量所对应的所述事例矢量,输出基于所确定的所述事例矢量的检索结果。
根据上述构成的数据管理系统,能够削减矢量附近检索的计算量而缩短数据检索的执行时间。
附图说明
图1是表示第一实施方式的数据管理系统的概要的系统结构图。
图2是表示数据表的具体例的图。
图3是表示在媒体数据为静止图像的情况下的由数据登记器进行的处理过程的一例的流程图。
图4是表示在媒体数据为动态图像的情况下的由数据登记器进行的处理过程的一例的流程图。
图5是表示索引构筑器的结构例的框图。
图6是表示LSH立即值表的一例的图。
图7是表示由LSH立即值索引信息生成器进行的处理过程的一例的流程图。
图8是表示LSH附近展开表的一例的图。
图9是表示将LSH附近展开表分割为两个而归一化后的例子的图。
图10是表示数据库复合索引的一例的图。
图11是表示由LSH附近展开索引信息生成器进行的处理过程的一例的流程图。
图12是说明关联数组和连续存储器配置型数组的图。
图13是表示检索器的结构例的框图。
图14是表示矢量类似性判断部的输入输出关系的图。
图15是表示由矢量类似性判断部进行的处理过程的一例的流程图。
图16是表示由严格检索器进行的处理过程的一例的流程图。
图17是表示由线性LSH检索器进行的处理过程的一例的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝;东芝数字解决方案株式会社,未经株式会社东芝;东芝数字解决方案株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580083082.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:指导终端设备操作的方法、装置和设备
- 下一篇:使用正压气体的手术抽吸装置