[发明专利]一种基于知识图谱的城市物联网数据分析框架在审
| 申请号: | 201710326193.3 | 申请日: | 2017-05-10 |
| 公开(公告)号: | CN107038257A | 公开(公告)日: | 2017-08-11 |
| 发明(设计)人: | 陈华钧;张宁豫;陈曦;吴朝晖 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 杭州天勤知识产权代理有限公司33224 | 代理人: | 胡红娟 |
| 地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 知识 图谱 城市 联网 数据 分析 框架 | ||
技术领域
本发明属于数据挖掘与城市计算领域,具体涉及一种基于知识图谱的城市物联网数据分析框架。
背景技术
信息通信技术(ICT)和物联网(IoT)的快速发展已经给城市的物理基础设施、建筑物、城市交通系统带来的巨大的变化。物理网设备和应用平台的融合对于智慧城市起着相当重要的作用。现阶段,数以亿计的物理传感器和社交媒体等每时每刻都产生着海量的数据流,为各种各样的城市应用服务。然而,直观地利用现有的人工智能技术统一物联网数据是相当困难的。传统的做法通常是利用语义映射封装底层的传感器,对外发布各种网络服务。
然而,城市的数据具有异构性的特点。例如,兴趣点数据是由地理坐标位置和所属分类来描述的,而空气质量数据是一组带有地理标签的时间序列。不同传感器的数据拥有不同的数据类型、数据分布、规模。此外,城市现有的数中隐藏有很多潜在的关联。现阶段,语义网技术已经被视为物联网技术的关键因素。然而,现有的框架都是面向特定传感器的数据流的应用,缺少结构化知识的表达、城市应用的通用框架和机器学习的整合。因此,将传感器的数据流组织成结构化的知识图谱,结合机器学习手段进行特征融合是相当可行的。
发明内容
有鉴于此,本发明提供了一种基于知识图谱的城市物联网数据分析框架。相比其他方法,本发明框架实现了城市底层物联网抽象、城市知识图谱的构建以及数据特征融合。
一种基于知识图谱的城市物联网数据分析框架,包括:
背景知识库,存储每个区域的静态数据;
物理实体层,采集每个区域的社交媒体传感器数据和物理传感器数据,形成数据流;
抽象实体层,为物理实体层的数据流添加语义标注,使来源于不同数据源的数据转化为通用的数据格式,并根据用户需求构造虚拟实体;
数据流层,根据应用需求将抽象实体层中处理后的相应数据流发送至融合层;
融合层,根据虚拟实体融合接收的数据流中相应的社交媒体数据与传感器数据、背景数据库中的背景数据,并将其结构化组织成城市知识图谱;
应用层,将城市知识图谱通过接口输送至外部;或通过自身整合的机器学习框架,实现对城市知识图谱的分析。
所述的机器学习框架包括迁移学习和极限学习,将城市知识图谱作为机器学习框架的输入,能够解决数据稀缺和学习效率问题。
所述背景知识库的构建为:
利用OpenStreetMap或Baidu Map API获得与时间无关的静态数据;
利用Yago2或WikiData获得每个静态数据映射到的实体,得到实体拥有的属性关系,组成背景知识库。
对于每个区域,利用传感器不仅获得非结构化的数据如兴趣点等,还利用现有的知识库获得结构化语义书。例如,除了可以获得一个区域有“星巴克”,同时这类是属于“咖啡店”,也可以从知识库获得“离这个地点最近的咖啡店”、“这个城市最大的星巴克再哪里”等知识。
所述的物理实体层中的每一个传感器根据逻辑实体(AE)和通用服务实体(CSE)来为上层的应用提供相应的数据流。oneM2M(one Machine to Machine,一种统一的物联网)国际标准中,逻辑实体是指的是应用实体(Application Entity,AE),也就是具体的数据资源的来源,如社交媒体、空气质量、出租车轨迹、交通状况等。通用服务实体(Common Service Entity,CSE)是oneM2M定义的一套服务功能,这些功能通过各种接口开放给其他层如抽象实体层,是层之间数据的桥梁。
所述的物理实体层是一个底层的数据接口,从传感器等数据源获得数据,将数据和实体做语义映射,然后作为抽象实体层的输入。
所述的抽象实体层隐藏了底层的复杂设备,比如,空气质量传感器、空气状况相关的微博文本信息、空气质量发布平台等都是可以获得空气质量数值的数据源,抽象实体“空气质量(虚拟的并不存在)”整合了以上的多个空气质量数据源,并隐藏了不同数据源之间获取数据方式的差异性。通过访问抽象实体可以获得空气质量数据而无需关心底层复杂的设备。
每一个抽象实体层的虚拟实体其实都是由融合层带来的外部应用需求创造的。例如,一个用户请求某一个区域的空气质量,然后一个新的虚拟实体(融合了空气传感器和空气质量相关的社交媒体)就被创造出来,通过查询这一虚拟实体,无需关系底层细节就可以获得区域的空气质量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710326193.3/2.html,转载请声明来源钻瓜专利网。





