[发明专利]基于OD数据感知城市动态结构演化规律的可视分析方法有效
| 申请号: | 201811205749.4 | 申请日: | 2018-10-16 |
| 公开(公告)号: | CN109254984B | 公开(公告)日: | 2020-10-23 |
| 发明(设计)人: | 史晓颖;吕凡顺;僧德文 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/248 |
| 代理公司: | 杭州浙科专利事务所(普通合伙) 33213 | 代理人: | 吴秉中 |
| 地址: | 310018 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 od 数据 感知 城市 动态 结构 演化 规律 可视 分析 方法 | ||
1.一种基于OD数据感知城市动态结构演化规律的可视分析方法,其中OD数据指交通起止点数据,包括如下步骤:
步骤1:收集OD数据,并存储在数据库中;
步骤2:对位置进行聚类,对轨迹按位置聚类和小时聚合;
步骤3:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;
步骤4:基于位置聚类网络序列,定义LDA模型,LDA模型指文档主题生成模型,训练得到主题模型,并对主题基于重要程度排序;
步骤5:设计主题-时间视图,可视化不同主题在每个位置网络中的概率分布,展示不同主题随着时间的演化特征;
步骤6:设计边关联视图,直观展示重要区域的空间分布和它们之间的流量关系;
步骤7:设计边流量时间分布视图,展示边关联视图中每条弧线在不同时间步下出现的概率;
所述步骤1包括:
获取OD数据集,并存储在轨迹记录表中,一条轨迹记录trajRec表示如下:
trajRec=[startLocLong,startLocLat,startTime,endLocLong,endLocLat,endTime]
其中startLocLong和startLocLat为出发地点的经度和纬度,startTime为出发时间,endLocLong和endtLocLat为到达地点的经度和纬度,endTime为到达时间;
所述步骤2包括:
步骤2.1:对所有位置进行聚类:假设locSet={locLongi,locLati}(1≤i≤n)为包含所有出发地点和到达地点的位置集合,一共有n个位置点;locLongi和locLati为第i个位置点的经度和纬度;第i个位置点和第j个位置点之间的距离定义为:使用k-means算法根据距离定义将地理相邻的位置聚合在一起,获取得到位置聚类集合cluLocSet={cluLoci}(1≤i≤k),其中k是聚类个数,一个位置聚类cluLoci中包含了多个相邻的位置点;
步骤2.2:将轨迹按位置聚类和小时聚合,基于trajRec,以小时为单位统计某两个聚类间在单位时间内的人流量,并存储加速后续计算;聚合后的一条记录trajAggrRec表示为:
trajAggrRec=[startDate,startHour,startCluLoc,endCluLoc,flowNum]
其中startDate表示出发日期,startHour表示出发小时,可以从starttTme中提取得到;startCluLoc和endCluLoc表示出发和到达的位置聚类的ID,flowNum表示在某日(startDate)某小时(startHour)内,从startCluLoc内出发到达endCluLoc的人流量;
所述步骤3包括:
按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;假设Gτ=(cluLocSet,Eτ)表示在时间步τ下的位置聚类网络,用一个图结构表示;其中位置聚类集合cluLocSet被看作是顶点集合,Eτ为边集合;eijτ∈Eτ表示在时间步τ内从cluLoci出发到达cluLocj的人流量,具体的值从trajAggrRec中查询得到;然后按小时构建位置聚类网络序列NS={G1,G2,...,GT},T为所有时间步的总数,由待分析的时间段内的日期数d决定,T=24×d;
所述步骤4包括:
步骤4.1:基于位置聚类网络序列,定义LDA模型;LDA模型包含3层:文档、单词和主题;一篇文档是由一组单词构成的集合,所有的文档集构成了一个语料库;一篇文档可以包含多个主题,文档中每一个词都由其中的一个主题生成;将每个时间步下的位置聚类网络Gτ看作是一篇文档,从而位置聚类网络序列NS={G1,G2,...,GT}构成了一个语料库;将边集合Eτ看作是一篇文档Gτ中的单词集合,一条边的权重eijτ对应于一个单词在一篇文档中出现的频率;主题为网络序列中的结构信息,隐含了城市动态相关的、重要的语义信息;
步骤4.2:通过将位置聚类网络定义为文档,将网络中的边关联定义为单词,训练得到一个主题模型,推理OD数据集中隐含的K个主题;采用EM算法训练得到模型参数,EM算法指最大期望算法,采用Gibbs采样计算得到2个概率分布:网络-主题概率分布和主题-边关联概率分布;对于网络-主题概率分布来说,每一个网络代表了一些主题所构成的一个概率分布;用θτ表示网络Gτ的主题概率分布,θτ,k表示主题k在Gτ网络中的概率;对于主题-边关联概率分布来说,由于每一个主题又代表了很多边所构成的一个概率分布,一条边在不同的主题上具有不同的概率;对于主题k,计算得到的边关联概率由表示;在一个主题中,具有高概率的边被认为更能代表那个主题;
步骤4.3:对主题基于重要程度排序;由于每个主题在不同的位置聚类网络中具有不同的概率,一个主题在所有网络中的概率和表征了这个主题的重要程度;对于第k个主题,计算表示第k个主题在所有网络中的概率和;sumProk的值越大,表示对应的主题越重要;在计算得到所有主题的sumProk后,基于此对主题进行重要程度排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811205749.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





