[发明专利]基于Spark的大数据开发方法及装置、终端有效
申请号: | 201810755408.8 | 申请日: | 2018-07-10 |
公开(公告)号: | CN109086038B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 刘霄峰 | 申请(专利权)人: | 千寻位置网络有限公司 |
主分类号: | G06F8/33 | 分类号: | G06F8/33;G06F8/41;G06F8/20 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 赵秀芹 |
地址: | 200433 上海市杨浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 spark 数据 开发 方法 装置 终端 | ||
本发明适用于大数据开发技术领域,提供了一种基于Spark的大数据开发方法及装置、终端,所述大数据开发方法包括:安装集成开发环境,方便引入模板工程;下载新近的模板工程,同时进行编译打包,生成软件开发工具包;加所述软件开发工具包到所述集成开发环境中,形成一开发模板;新建大数据开发工程,应用所述开发模板进行大数据开发。本发明中,基于模板的开发方式不仅仅提供了封装的类和方法,同时提供了直接可运行的开发模板,提高了开发效率,降低了入门门槛,用最简单有效的方式加快开发进度。
技术领域
本发明属于大数据开发技术领域,尤其涉及一种基于Spark的大数据开发方法及装置、终端。
背景技术
近年来越来越多的工具开发包给我们的开发任务带来了极大的便利,即技术人员通过自有的封装手段,将一些依赖和实用方法进行封装,然后他人通过引用的方式进行使用。这种方法是目前最普遍的技术和功能共享方式,但是此类方式也存在一定的弊端,即对于初学者不友好,对于Spark等开发封装的不够彻底,对于很多人无法快速上手。
现有的工具开发包仅提供了封装方法或者父类,通过继承和引用的方式使用,用户对于内部方法需要进行一定的解读才能很好地使用,并且需要通过其他信息来源对Spark开发进行相应了解,才能真正的开始进行任务开发。这样导致了上手较慢,开发困难等问题,增加了额外开发成本。
发明内容
本发明实施例提供了一种基于Spark的大数据开发方法及装置、终端,旨在解决现有技术的开发方式封装不够彻底,无法快速上手的问题。
一种基于Spark的大数据开发方法,包括:
安装集成开发环境,方便引入模板工程;
下载新近的模板工程,同时进行编译打包,生成软件开发工具包;
添加所述软件开发工具包到所述集成开发环境中,形成一开发模板;
新建大数据开发工程,应用所述开发模板进行大数据开发。
优选地,所述安装集成开发环境之后,还包括:安装Maven仓库和IDE的Maven插件。
优选地,所述开发模板包括通用模板,数据清洗模板和Spark算子模板的至少之一。
优选地,所述开发模板包含输入参数的读取和规整、数据的输入和输出以及中间清洗方法的选择。
优选地,所述新建大数据开发工程,应用所述开发模板进行大数据开发的步骤,包括:
根据所述开发模板的代码进行相应改动完成大数据开发,或
继续拓展所述开发模板,简化开发流程,共享代码架构。
优选地,所述开发模板为带有详细注释和能够快速运行的代码,所述应用所述开发模板进行大数据开发的步骤,包括:
根据注释选择需要的数据源写入方法,选择合理的RDD操作算子,选择需要的数据源输入方法;
根据需要对所述代码进行修改或者删减。
本发明还提供一种基于Spark的大数据开发装置,其特征在于,包括:
安装单元,用于安装集成开发环境,方便引入模板工程;
编译单元,用于下载新近的模板工程,同时进行编译打包,生成软件开发工具包;
添加单元,用于添加所述软件开发工具包到所述集成开发环境中,形成一开发模板;
开发单元,用于新建大数据开发工程,应用所述开发模板进行大数据开发。
优选地,所述安装单元还包括:安装Maven仓库和IDE的Maven插件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于千寻位置网络有限公司,未经千寻位置网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810755408.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置