[发明专利]一种基于多维数据立方体的数据处理方法及电子装置在审
申请号: | 202010842774.4 | 申请日: | 2020-08-20 |
公开(公告)号: | CN114077652A | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 罗宁;王伟 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/951;G06F16/958 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余功勋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 数据 立方体 数据处理 方法 电子 装置 | ||
1.一种基于多维数据立方体的数据处理方法,其步骤包括:
1)采集若干数据,获取各数据的字段名称,并对各数据进行语义化分析;
2)依据字段名称与语义化分析结果,赋予各数据一或多个标签,并将各标签存入多维数据立方体的相应维度目录下;
3)依据一查询分析指令,获取任务配置,并通过任务配置及维度目录下的标签,获取相应数据;
4)根据不同类型数据的处理方法,对各相应数据进行自适应匹配,得到查询分析指令中设定形式的结果。
2.如权利要求1所述的方法,其特征在于,所述数据包括:行政数据、行业数据、社会数据和互联网数据。
3.如权利要求1所述的方法,其特征在于,采集若干数据的方法包括:数据目录申请订阅方法、数据服务接口方法和自动网络爬取方法;通过以下步骤进行数据目录申请订阅方法:
1)向互联网中各节点发布数据目录;
2)当收到一节点的订阅申请审批后,与该节点进行交换任务管理;
3)定期对数据进行自动采集。
4.如权利要求1所述的方法,其特征在于,获取各数据的字段名称之前,对各数据进行预处理;通过一耦合数据规则和业务规则的数据滤选器,对各数据进行预处理。
5.如权利要求1所述的方法,其特征在于,所述维度包括:主题维度、地区维度和类型维度;所述地区维度包括国家、省市、地市、区县和乡镇。
6.如权利要求1所述的方法,其特征在于,通过中文分词和文本解析,实现查询分析指令的自然语言查询到机器语言的翻译。
7.如权利要求1所述的方法,其特征在于,任务配置包括:任务类型配置、任务脚本配置、任务数据配置、任务周期配置和任务状态配置。
8.如权利要求1所述的方法,其特征在于,所述设定形式包括立方体、图、表和文件。
9.一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行权利要求1-8中任一所述方法。
10.一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行如权利要求1-8中任一所述方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010842774.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置