[发明专利]基于分布式并行计算的大数据挖掘系统在审
申请号: | 201711491787.6 | 申请日: | 2017-12-30 |
公开(公告)号: | CN110019414A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 周峻松;徐继峰;祁建明;陈墩金 | 申请(专利权)人: | 广州明领基因科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/215;G06F16/28;G06F9/48 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510610 广东省广州市天河区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务调度控制模块 算法模块 分布式并行计算 客户端模块 挖掘系统 大数据 数据集 预处理 数据存取接口 用户提供系统 并行算法 访问接口 功能部件 交互界面 任务调度 原始数据 调用 管理 协调 | ||
1.基于分布式并行计算的大数据挖掘系统,其特征在于,所述系统包括:客户端模块、任务调度控制模块、算法模块以及数据集模块;其中,所述客户端模块负责为用户提供系统交互界面以及访问接口;所述任务调度控制模块是整个系统任务调度的核心,负责管理调用各功能部件并协调各部件的运行;所述算法模块主要负责管理并行算法库;所述数据集模块负责对原始数据进行预处理,并提供高效的数据存取接口,将处理后的数据高效地提交给所述任务调度控制模块以及所述算法模块使用。
2.根据权利要求1所述的基于分布式并行计算的大数据挖掘系统,其特征在于,所述客户端模块包括计算机、手机等终端用户。
3.根据权利要求1所述的基于分布式并行计算的大数据挖掘系统,其特征在于,所述任务调度控制模块由任务调度控制部件与知识库构成;其中,所述任务调度控制部件可接收用户界面和开放接口发出的客户请求并协调其他各功能部件实现系统功能;所述知识库是知识工程中结构化、易操作、易利用、全面有组织的知识集群,采用知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合,对于用户满意的数据挖掘结果,可作为有用的知识存入知识库,从而引导用户评价挖掘结果。
4.根据权利要求1所述的基于分布式并行计算的大数据挖掘系统,其特征在于,所述算法模块中的并行数据挖掘算法库是一个重要的功能部件,是算法模块的重要支撑,对其的管理是通过所述任务调度控制部件实现的。
5.根据权利要求1所述的基于分布式并行计算的大数据挖掘系统,其特征在于,所述数据集模块主要包括数据仓库与数据文件组成的数据源以及数据预处理与数据存取管理等功能部件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州明领基因科技有限公司,未经广州明领基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711491787.6/1.html,转载请声明来源钻瓜专利网。