[发明专利]一种基于最优空间分解的乘积量化近邻检索方法在审
申请号: | 202210423082.5 | 申请日: | 2022-04-21 |
公开(公告)号: | CN115292537A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 张仕;陈伟林 | 申请(专利权)人: | 福建师范大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/583;G06F16/51;G06V10/762;G06V10/77;G06K9/62 |
代理公司: | 福州科扬专利事务所(普通合伙) 35001 | 代理人: | 魏珊珊 |
地址: | 350117 福建省福州市闽*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 最优 空间 分解 乘积 量化 近邻 检索 方法 | ||
1.一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,包括以下步骤:
获取样本数据集;
求解样本数据集的空间分解最优解;
按空间分解最优解将样本数据集分解至M个子空间,并分别在各子空间内进行聚类分析,得到若干个簇;以簇质心为索引,构建倒排序表;
获取待检索数据;
按所述空间分解最优解将检待索数据分解至M个子空间,并分别在各子空间内检索若干个最接近簇;计算所述若干个最接近簇的笛卡尔积,得到若干个候选编码集;
根据所述多个候选编码集,查询倒排序表得到检索结果集。
2.根据权利要求1所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,还包括:利用PCA算法对样本数据进行降维处理。
3.根据权利要求1所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,求解所述空间分解最优解,具体步骤为:
以分解后各子空间内数据维度的方差乘积平方根的累加值最小为目标,构建目标函数;求解所述目标函数,得到所述空间分解最优解。
4.根据权利要求3所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,所述目标函数以公式表达为:
式中,表示第s子空间内数据维度的方差乘积平方根;M表示子空间总数。
5.根据权利要求4所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,求解目标函数,包括如下步骤:
A1、选取样本数据集中方差第t大和方差第t小的维度分配至SRVP值最小的子空间并更新该子空间的SRVP值,直至该子空间内维度数量等于D/M;
A2、重复步骤A1,直至所有维度都被分配至子空间。
6.根据权利要求1所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,还包括:根据量化误差,设置各子空间的最接近簇数量。
7.根据权利要求6所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,所述子空间的量化误差越小,该子空间的最接近簇数量越多。
8.根据权利要求6所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,所述设置各子空间的最接近簇数量,具体步骤为:
预设一最接近簇总数Z;
根据量化误差占比对各子空间进行排序;
根据未确定最接近簇数量值的子空间数量和最接近簇总数Z,计算该子空间的最接近簇数量值;根据计算得到的最接近簇数量值,更新Z值;按排序结果,顺序计算下一子空间的最接近簇数量值并更新Z值,直至得到所有子空间的最接近簇数量值。
9.根据权利要求8所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,还包括:
计算某一子空间的量化误差占比;根据所述量化误差占比,计算该子空间的权重值;根据所述权重值,调整该子空间的最接近簇数量值。
10.根据权利要求9所述的一种基于最优空间分解的乘积量化近邻检索方法,其特征在于,所述计算子空间最接近簇数量,以公式表达为:
式中,Rs表示第s子空间的最接近簇数量;floor()表示向下取整函数;ceil()表示向上取整函数;ps表示第s子空间的量化误差占比;Z表示最接近簇总数;M-i表示未确定最接近簇数量值的子空间数量;M表示子空间总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建师范大学,未经福建师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210423082.5/1.html,转载请声明来源钻瓜专利网。