[发明专利]一种数据处理方法、装置和系统在审
申请号: | 202110521146.0 | 申请日: | 2021-05-13 |
公开(公告)号: | CN113177049A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 张宁;刘林 | 申请(专利权)人: | 中移智行网络科技有限公司;中移(上海)信息通信科技有限公司;中国移动通信集团有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2455;G06F16/36;G06F16/182;G06F16/21 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;曹娜 |
地址: | 201206 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 系统 | ||
本发明提供一种数据处理方法、装置和系统,该方法包括:通过批处理,获取目标区域的历史交通场景的第一要素数据;通过流处理,获取目标区域的实时交通场景的第二要素数据;对第一要素数据和第二要素数据进行聚合处理,并将聚合后的要素数据存储在目标区域对应的缓存区中。本发明对于数据量庞大的历史交通场景的第一要素数据采用批处理的方式导入,对于数据量较小的实时交通场景的第二要素数据采用流处理的方式导入,提高了数据的导入速率,可提供后续数据的检索分析效率,另外,将导入的第一要素数据和第二要素数据放在缓存区中,无需每次重新获取上述要素数据,能够进一步提高数据的检索分析效率,进而能够快速地检索出交通场景下的业务数据。
技术领域
本发明涉及数据库技术领域,特别是指一种数据处理方法、装置和系统。
背景技术
现有数据湖存储方法,大多泛指异构数据或全数据形态的数据的存储,描述范围比较大,涵盖数据形式也比较宽泛,没有具体针对某一行业某种场景的具体业务数据,检索结果比较散杂,数据分析效率较低,难以快速地检索出某种具体应用场景下的业务数据,进而导致数据湖不具备专业应用能力。
发明内容
本发明的目的是提供一种数据处理方法、装置和系统,以解决基于现有数据湖难以快速地检索出某种具体应用场景下的业务数据的问题。
为达到上述目的,本发明的实施例提供一种数据处理方法,包括:
通过批处理,获取目标区域的历史交通场景的第一要素数据;
通过流处理,获取所述目标区域的实时交通场景的第二要素数据;
对所述第一要素数据和第二要素数据进行聚合处理,并将聚合后的要素数据存储在所述目标区域对应的缓存区中。
可选地,所述将聚合后的要素数据存储在所述目标区域对应的缓存区中,包括:
将聚合后的要素数据以键值对K-V的形式存储在所述目标区域对应的缓存区中。
可选地,本发明实施例的方法,还包括:
根据所述第一要素数据和所述第二要素数据,确定目标交通场景中目标交通事件的发生次数;
在所述目标交通事件的发生次数大于预设阈值的情况下,发送警示信息。
可选地,根据所述第一要素数据和所述第二要素数据,确定目标交通场景中目标交通事件的发生次数,包括:
在所述第一要素数据和第二要素数据中,按照预设筛选规则,筛选出目标交通场景对应的数据;
根据所述目标交通场景对应的数据,确定目标交通事件的发生次数。
可选地,所述第一要素数据或所述第二要素数据包括以下至少一项:
交通参与者;
道路场景;
交通参与者的行为特征;
道路交通标志或属性;
路面标志;
天气因素。
可选地,本发明实施例的方法,还包括:
获取检索关键词;
在所述缓存区中,基于预设交通场景要素关系图谱,查找与所述检索关键词有关联关系的交通场景目标要素数据;
根据所述交通场景目标要素数据,获取查询结果;
其中,所述预设交通场景要素关系图谱中保存有交通场景的要素数据之间的关联关系。
为了实现上述目的,本发明实施例还提供了一种数据处理装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移智行网络科技有限公司;中移(上海)信息通信科技有限公司;中国移动通信集团有限公司,未经中移智行网络科技有限公司;中移(上海)信息通信科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110521146.0/2.html,转载请声明来源钻瓜专利网。