[发明专利]一种基于微型计算平台的实时响应大媒体近邻检索方法有效
申请号: | 201810038892.2 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108256058B | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 王振;孙福振;王雷;李鑫鑫 | 申请(专利权)人: | 山东理工大学 |
主分类号: | G06F16/43 | 分类号: | G06F16/43 |
代理公司: | 济南智圆行方专利代理事务所(普通合伙企业) 37231 | 代理人: | 张玉琳 |
地址: | 255000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 微型 计算 平台 实时 响应 媒体 近邻 检索 方法 | ||
本发明公开了一种基于微型计算平台的实时响应大媒体近邻检索方法,涉及检索技术领域,技术方案为提出了一种新型的快速生成多媒体二值特征的方法和一种高区分性的后验证距离表,首先,本文根据数据集的聚类特性生成初始中心点,使得算法能够快速收敛到最优解。然后,学习满足序列保持的哈希映射函数,保证所得二值编码能保持数据点之间的原序列关系。最后,根据数据点的二值编码建立高区分性的距离表。本发明的有益效果是:解决了在微型计算平台上实时响应大媒体数据近邻检索请求的问题,其对存储资源以及计算能力的要求较低,并构建了适应于微型计算平台的近邻检索体系。
技术领域
本发明涉及检索技术领域,特别涉及一种基于微型计算平台的实时响应大媒体近邻检索方法。
背景技术
近年来,多媒体技术的快速发展使得网络中的共享多媒体数据呈指数形式增长,人们开始关注海量多媒体数据的近邻检索问题。
传统多媒体数据的特征一般为高维浮点型向量,例如SIFT(尺度不变特征变换)特征是128维的浮点型向量,而GIST特征[2]为320维或640维的浮点型向量。若通过计算并比较浮点型特征向量之间的欧式距离来检索多媒体近邻点,其计算复杂度较高,对计算平台的性能要求较苛刻。再者,将所有浮点型数据一次性全部调入计算平台的内存中,需要占用大量的存储资源。上述两点使得微型计算平台无法实时响应海量多媒体的近邻检索请求。为此,人们提出将高维浮点型向量转化为紧凑二进制编码,并根据汉明距离关系检索多媒体近邻点。
最早提出利用二值编码检索近邻点的是局部敏感哈希算法,其采用随机的方式生成满足局部敏感特性的线性哈希映射函数。但是,算法的训练过程不依赖于训练数据集,若要得到令人满意的近邻检索结果,其所生成的二进制编码应足够长。
为了保证采用紧凑二值编码也能获取较优的近邻检索性能,人们开始探索利用机器学习方法,依据训练数据集,生成满足特定约束条件的二进制编码。谱哈希算法[4]根据数据点之间的相似性构造谱图,并通过分割相似性谱图学习数据点的二值编码。迭代量化哈希算法[5]将超立方体的顶点作为编码中心点,并根据数据点与超立方体顶点之间的距离关系生成数据点的二值编码,但超立方体的顶点是固定不变的,所生成的二值编码的空间分布自适应能力较差。K均值哈希算法[6]提出编码中心点应满足聚类分布特性,从而保证所生成的二值编码符合数据集的空间分布特性。
为了能够在汉明空间内得到较优的近邻检索性能,许多哈希算法建立了相似性保持约束条件。二值重建哈希算法[7]要求最小化数据点对的汉明距离和欧式距离之间的差值,核监督哈希算法[8]要求数据点在汉明空间和欧式空间内的相似性具有较高的一致性。上述哈希算法中的定义属于绝对相似性保持约束条件,但近似近邻检索任务更加关注数据点之间的相对相似性。三元损失哈希算法[9]要求三元组之间的相对关系在汉明空间和原空间内是一致的,序列监督哈希算法也基于三元组张量之间的相对关系定义目标函数,顶部排序监督二值编码算法重点关注近邻检索结果中排序较靠前的数据点之间的相对相似性。
多数哈希算法采用随机梯度下降算法优化原目标函数,但受二值编码长度以及随机梯度下降算法本身的局限性,单组二值编码已无法准确表达数据点之间的近邻关系。为此,人们探索生成多重二值编码,从而能够较好地解决局部优解的问题。Charikar等人提出多重局部敏感哈希算法(MLSH),其采用随机的方式,生成数据点的多重二值编码,并根据平均汉明距离返回近邻点。K均值局部敏感哈希算法(KLSH)[13]采用随机的方式生成多组初始中心点,并利用随机梯度下降算法优化目标函数学习多组二进制编码。与KLSH算法单独生成每组二值编码的机制不同,联合倒排索引算法(JII)一次性生成数据点的多个二值编码中心点,然后依据它们之间的相似性关系对其分组,从而形成多组二值编码。
发明内容
为了实现上述发明目的,本发明提出了一种基于微型计算平台的实时响应大媒体近邻检索方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东理工大学,未经山东理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810038892.2/2.html,转载请声明来源钻瓜专利网。