[发明专利]一种相似性连接查询方法及装置有效
| 申请号: | 201910130094.7 | 申请日: | 2019-02-21 |
| 公开(公告)号: | CN109783547B | 公开(公告)日: | 2020-08-21 |
| 发明(设计)人: | 马友忠;张瑞玲;林春杰;李莹 | 申请(专利权)人: | 洛阳师范学院 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 李永宏 |
| 地址: | 471000 河南*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 相似性 连接 查询 方法 装置 | ||
1.一种相似性连接查询方法,其特征在于,包括:
获取待查询的原始向量集合、结果向量数量和初始结果向量对集合;其中,所述原始向量集合为进行相似性连接查询的原始图像数据集合,所述初始结果向量对集合为相似性连接查询结果的初始图像数据集合,所述结果向量数量表示相似性连接查询结果的向量对个数,表示所述原始图像数据集合中相似图像的数量;
对所述原始向量集合进行分组处理,得到多个子向量分组集合;
根据所述结果向量数量和所述多个子向量分组集合构建所述原始向量集合的相似度分布直方图;
根据所述相似度分布直方图和所述结果向量数量,计算向量距离阈值;
根据多个所述子向量分组集合、所述向量距离阈值和所述结果向量数量更新所述初始结果向量对集合,得到用于表示相似性连接查询结果的结果向量对集合;
其中,根据所述结果向量数量和多个子向量分组集合构建所述原始向量集合的相似度分布直方图,包括;
根据预设区间划分规则和所述原始向量集合,获取多个距离向量区间;
根据多个所述子向量集合计算每个所述距离向量区间对应的总体相似结果估计值;
根据每个所述距离向量区间对应的总体相似结果估计值构建所述原始向量集合的相似度分布直方图。
2.根据权利要求1所述的相似性连接查询方法,其特征在于,所述根据预设区间划分规则和所述原始向量集合,获取多个距离向量区间,包括:
将所述原始向量集合中的原始向量进行配对组合处理,得到多个原始向量对;
计算每个原始向量对中两个原始向量之间的向量距离,得到向量距离集合;
在所述向量距离集合中选择出最大的向量距离作为待划分区间的区间上限值;
根据所述区间上限值、预设区间下限值和预设区间划分规则,将所述待划分区间划分为多个子区间,多个所述子区间为多个距离向量区间。
3.根据权利要求1所述的相似性连接查询方法,其特征在于,所述根据多个所述子向量分组集合计算每个所述距离向量区间对应的总体相似结果估计值,包括:
对每个所述子向量分组集合进行抽样处理,得到与每个所述子向量集子向量分组集合对应的抽样向量集合;
确定每个所述距离向量区间对应的至少一个子向量分组集合;
根据每个所述距离向量区间对应的至少一个子向量分组集合计算与每个所述距离向量区间对应的分组内结果数量估计值和分组间结果数量估计值;
根据与每个所述距离向量区间对应的分组内结果数量估计值和与每个所述距离向量区间对应的分组间结果数量估计值,计算与每个所述距离向量区间对应的总体相似结果数量估计值;其中,所述总体相似结果数量估计值为所述距离向量区间对应的所述至少一个子向量分组集合的总体相似结果数量估计值。
4.根据权利要求1所述的相似性连接查询方法,其特征在于,对所述原始向量集合进行分组处理,得到多个子向量分组集合,包括:
获取所述原始向量集合的原始向量维度;
根据所述原始向量维度和预设降维后维度对所述原始向量集合进行降维处理,得到降维向量集合;
对所述降维向量集合进行符号化处理,得到字符串集合;
根据所述字符串集合对所述原始向量集合进行分组处理,得到多个子向量分组集合;其中,所述字符串集合中的一个字符串对应一个子向量分组集合。
5.根据权利要求4所述的相似性连接查询方法,其特征在于,所述根据多个所述子向量分组集合、所述向量距离阈值和所述结果向量数量更新所述初始结果向量对集合,得到用于表示相似性连接查询结果的结果向量对集合,包括:
判断所述初始结果向量对集合中的向量对个数是否小于所述结果向量数量;
如果所述初始结果向量对集合中的向量对个数不小于所述结果向量数量,则根据所述字符串集合和多个所述子向量分组集合对所述初始结果向量对集合进行更新处理,直至更新后的初始结果向量对集合中的向量对个数不小于所述结果向量数量为止,得到最终更新的初始结果向量对集合;
从所述最终更新的初始结果向量对集合中提取所述结果向量数量的向量对,组合得到用于表示相似性连接查询结果的结果向量对集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于洛阳师范学院,未经洛阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910130094.7/1.html,转载请声明来源钻瓜专利网。





