[发明专利]一种私有云数据传输方法及数据管理平台在审
| 申请号: | 202111613553.0 | 申请日: | 2021-12-27 |
| 公开(公告)号: | CN114297281A | 公开(公告)日: | 2022-04-08 |
| 发明(设计)人: | 刘波;陈帅斌;蒋泽飞;王晨程 | 申请(专利权)人: | 杭州登虹科技有限公司 |
| 主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/27;G06F16/28;G06F16/22;G06F16/2458 |
| 代理公司: | 杭州裕阳联合专利代理有限公司 33289 | 代理人: | 张解翠 |
| 地址: | 310000 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 私有 数据传输 方法 数据管理 平台 | ||
本发明公开了一种私有云数据传输方法及数据管理平台,涉及大数据处理技术领域,所述方法主要包括:利用flume组件、sqoop组件和datax组件采集异构数据,并通过canal组件将所述异构数据统一传输到kafka组件中,同时将所述异构数据分别存储在hive组件和hbase组件中;利用MapReduce组件和Spark组件对存储在hive组件中的数据进行离线计算;利用phoenix组件为存储在hbase组件中的数据添加二级索引,并利用Spark组件和flink组件对数据进行实时计算;利用DBapi组件为所述hive组件和所述hbase组件提供一致的访问接口,以实现数据的输出。本方案中将离线数据统一存储在hive组件中,实时数据通过flink组件或Spark组件编写ETL后实时传输到hbase组件,且hbase组件使用phoenix组件作为客户端连接DBapi组件,实现了多源数据统一输出存储。
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种私有云数据传输方法及数据管理平台。
背景技术
政府对于运营“云”的有关法律、法规目前还不是很完善,集团性企业一般有明显的竞争对手和重要数据等需要保密的信息,如果用公有云,数据出了问题很难追究责任,同时“云”运营商计费标准不统一,流量计费千差万别,企业有时需要独立的专线,费用谁来承担尚无标准,目前具备给集团企业提供“云”服务的运营商,数量还不多而且相互之间严重隔离,一旦更换云服务商,数据迁移是个大问题(数据标准、企业数据量一般很大等等)。
传统私有云组件服务多需要的部署周期长,对外输出数据的数据服务层涉及到的数据结构复杂并且是多源数据库,需要的开发人员比较多,同时要求开发者技能丰富,因此,如何实现数据输出以满足各种离线计算、实时计算以及复杂的数据分析场景,就需要有一个多功能的数据服务层实现多源数据的统一,大型公司自研的数据湖功能的数据服务层结构复杂,涉及的技术繁多,部署比较耗费资源且开源的很少,要满足企业自身的需求二次开发比较困难。
发明内容
本发明提供的一种私有云数据传输方法,旨在解决现有技术中私有云不能实现多源数据统一输出存储及离线数据产出时间长的问题。
为实现上述目的,本发明采用以下技术方案:
本发明的一种私有云数据传输方法,包括:
利用flume组件、sqoop组件和datax组件采集异构数据,并通过canal组件将所述异构数据统一传输到kafka组件中;
kafka组件接收所述异构数据,并按照数据类型将所述异构数据分别存储在hive组件和hbase组件中,所述数据类型包括离线数据和实时数据;
利用MapReduce组件和Spark组件对存储在hive组件中的数据进行离线计算;
利用phoenix组件为存储在hbase组件中的数据添加二级索引,并利用Spark组件和flink组件对数据进行实时计算;
利用DBapi组件为所述hive组件和所述hbase组件提供一致的访问接口,以实现数据的输出。
作为优选,所述利用DBapi组件为所述hive组件和所述hbase组件提供一致的访问接口,以实现数据的输出还包括:通过DBapi组件连接phoenix组件编写SQL语句以实现hbase组件中数据的实时输出。
作为优选,所述利用DBapi组件为所述hive组件和所述hbase组件提供一致的访问接口,以实现数据的输出还包括:使用java springboot框架,封装jdbc驱动,解析json参数,拼接动态SQL,使用SQL语言开发,连接数据库并编写数据接口。
作为优选,所述利用DBapi组件为所述hive组件和所述hbase组件提供一致的访问接口,以实现数据的输出还包括:利用token验证,对访问所述hive组件或所述hbase组件的ip进行黑白名单检验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州登虹科技有限公司,未经杭州登虹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111613553.0/2.html,转载请声明来源钻瓜专利网。





