[发明专利]一种分布式并行向量比对计算方法及系统在审
| 申请号: | 202211381338.7 | 申请日: | 2022-11-04 |
| 公开(公告)号: | CN115618184A | 公开(公告)日: | 2023-01-17 |
| 发明(设计)人: | 刘鹏;张真;刘子扬 | 申请(专利权)人: | 南京云创大数据科技股份有限公司 |
| 主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F9/50;G06F16/23;G06F16/2457;G06F16/27;G06F18/22 |
| 代理公司: | 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 | 代理人: | 孙丽君 |
| 地址: | 210000 江苏省南京市秦淮区永*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 分布式 并行 向量 计算方法 系统 | ||
本发明公开了一种分布式并行向量比对计算方法及系统,该方法包括以下步骤:S1、主控单元基于分布式资源调度将向量数据库中内容均衡分发至若干计算单元,形成比对向量集;S2、所述主控单元接收计算指令,将待计算的向量数据集发送至各个计算单元;S3、所述计算单元将向量数据集与所述比对向量集进行对比计算;S4、将计算结果按照相关性进行排序;S5、将前十个相关性最高的比对结果反馈至主控单元;S6、主控单元接收结果再次按照相关性进行排序。通过设置单主控计算单元配合多计算单元集成模块的分布式集群处理及资源调度原理,能够同时进行大量数据的并行计算,从而大幅提高任务的计算效率与反馈速度。
技术领域
本发明涉及向量数据计算技术领域,具体来说,涉及一种分布式并行向量比对计算方法及系统。
背景技术
用于机器学习和人工智能的处理通常需要对大型数据的集合执行数学操作,并且通常包括求解多重卷积层和池化层。机器学习和人工智能技术通常利用矩阵操作和非线性函数(诸如激活函数)。机器学习的应用包括自动驾驶汽车和驾驶员辅助汽车。在一些场景中,计算机处理器用于执行机器学习训练和推理。传统计算机处理器能够非常快速地执行单个数学操作,但是通常只能同时地对有限数量的数据进行操作。
向量基础数学库的计算过程为:首先,获取需要计算的向量数值和计算函数;然后,串行检测向量中包括的多个标量数值的状态,判断向量中的每个标量数值是否正常,若所有标量数值均处于正常状态,则将计算函数采用幂级数转换为多项式,再用SIMD指令集并行将所有标量数值代入多项式计算,得到多项式计算结果输出。
作为改进方案,可以利用图形处理单元(GPU),并且该GPU能够执行相同数学操作,但是可以对更大数据的集合执行并行数学操作。通过利用多个处理器核,GPU可以并行执行多个任务,并且通常能够完成比传统计算机处理器更快利用并行性的大型图形处理任务。然而,GPU和传统计算机处理器均非最初为机器学习或人工智能操作而设计。机器学习和人工智能操作通常依赖于对非常大的数据集重复应用特定机器学习处理器操作的集合。因此,在面对较大数量的向量集合计算时,传统的计算方式会因为存在较多重复的计算,以及冗余的处理步骤与数据筛选,影响向量数据的计算效率,不能满足日益提高的计算需求。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种分布式并行向量比对计算方法及系统,以克服现有相关技术所存在的上述技术问题。
为此,本发明采用的具体技术方案如下:
根据本发明的一个方面,提供了一种分布式并行向量比对计算方法,该方法包括以下步骤:
S1、主控单元基于分布式资源调度将向量数据库中内容均衡分发至若干计算单元,形成比对向量集;
S2、所述主控单元接收计算指令,将待计算的向量数据集发送至各个计算单元;
S3、所述计算单元将向量数据集与所述比对向量集进行对比计算;
S4、将计算结果按照相关性进行排序;
S5、将前十个相关性最高的比对结果反馈至主控单元;
S6、主控单元接收结果再次按照相关性进行排序,将前十个相关性最高比对结果作为输出并展示。
进一步的,所述主控单元将向量数据库中内容均衡分发至若干计算单元,分别形成比对向量集,包括以下步骤:
S11、主控单元连接大数据平台获取向量数据库并实时更新;
S11、建立所述主控单元与计算单元之间用于分布式数据匹配的通信连接;
S12、所述计算单元建立基于海杜普(Hadoop)的分布式存储;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京云创大数据科技股份有限公司,未经南京云创大数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211381338.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能化农业喷洒装置
- 下一篇:基于医防融合的糖尿病高危人群数据提取方法





