[发明专利]一种相似性连接查询方法及装置有效
| 申请号: | 201910130094.7 | 申请日: | 2019-02-21 |
| 公开(公告)号: | CN109783547B | 公开(公告)日: | 2020-08-21 |
| 发明(设计)人: | 马友忠;张瑞玲;林春杰;李莹 | 申请(专利权)人: | 洛阳师范学院 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 李永宏 |
| 地址: | 471000 河南*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 一种相似性连接查询方法及装置,涉及数据处理领域。在进行相似性连接性查询时,先获取进行相似性连接查询的原始向量集合、相似性连接查询结果的向量对个数以及相似性连接查询结果的初始数据集合,然后再对原始向量集合进行分组处理,得到多个子向量分组集合,并构建该原始向量集合的相似度分布直方图,再根据相似度分布直方图和结果向量数量,计算向量距离阈值,最后根据多个子向量分组集合、向量距离阈值和结果向量数量更新该初始结果向量对集合,得到用于表示相似性连接查询结果的结果向量对集合,实现了不需要人工预先设定向量距离阈值,能够减少大量的冗余计算,进而提升相似性连接查询效率。 | ||
| 搜索关键词: | 一种 相似性 连接 查询 方法 装置 | ||
【主权项】:
1.一种相似性连接查询方法,其特征在于,包括:获取待查询的原始向量集合、结果向量数量和初始结果向量对集合;其中,所述原始向量集合为进行相似性连接查询的数据集合,所述初始结果向量对集合为相似性连接查询结果的初始数据集合,所述结果向量数量表示相似性连接查询结果的向量对个数;对所述原始向量集合进行分组处理,得到多个子向量分组集合;根据所述结果向量数量和多个子向量分组集合构建所述原始向量集合的相似度分布直方图;根据所述相似度分布直方图和所述结果向量数量,计算向量距离阈值;根据多个所述子向量分组集合、所述向量距离阈值和所述结果向量数量更新所述初始结果向量对集合,得到用于表示相似性连接查询结果的结果向量对集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于洛阳师范学院,未经洛阳师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910130094.7/,转载请声明来源钻瓜专利网。





