[发明专利]基于OD数据感知城市动态结构演化规律的可视分析方法有效

专利信息
申请号: 201811205749.4 申请日: 2018-10-16
公开(公告)号: CN109254984B 公开(公告)日: 2020-10-23
发明(设计)人: 史晓颖;吕凡顺;僧德文 申请(专利权)人: 杭州电子科技大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/248
代理公司: 杭州浙科专利事务所(普通合伙) 33213 代理人: 吴秉中
地址: 310018 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 od 数据 感知 城市 动态 结构 演化 规律 可视 分析 方法
【权利要求书】:

1.一种基于OD数据感知城市动态结构演化规律的可视分析方法,其中OD数据指交通起止点数据,包括如下步骤:

步骤1:收集OD数据,并存储在数据库中;

步骤2:对位置进行聚类,对轨迹按位置聚类和小时聚合;

步骤3:按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;

步骤4:基于位置聚类网络序列,定义LDA模型,LDA模型指文档主题生成模型,训练得到主题模型,并对主题基于重要程度排序;

步骤5:设计主题-时间视图,可视化不同主题在每个位置网络中的概率分布,展示不同主题随着时间的演化特征;

步骤6:设计边关联视图,直观展示重要区域的空间分布和它们之间的流量关系;

步骤7:设计边流量时间分布视图,展示边关联视图中每条弧线在不同时间步下出现的概率;

所述步骤1包括:

获取OD数据集,并存储在轨迹记录表中,一条轨迹记录trajRec表示如下:

trajRec=[startLocLong,startLocLat,startTime,endLocLong,endLocLat,endTime]

其中startLocLong和startLocLat为出发地点的经度和纬度,startTime为出发时间,endLocLong和endtLocLat为到达地点的经度和纬度,endTime为到达时间;

所述步骤2包括:

步骤2.1:对所有位置进行聚类:假设locSet={locLongi,locLati}(1≤i≤n)为包含所有出发地点和到达地点的位置集合,一共有n个位置点;locLongi和locLati为第i个位置点的经度和纬度;第i个位置点和第j个位置点之间的距离定义为:使用k-means算法根据距离定义将地理相邻的位置聚合在一起,获取得到位置聚类集合cluLocSet={cluLoci}(1≤i≤k),其中k是聚类个数,一个位置聚类cluLoci中包含了多个相邻的位置点;

步骤2.2:将轨迹按位置聚类和小时聚合,基于trajRec,以小时为单位统计某两个聚类间在单位时间内的人流量,并存储加速后续计算;聚合后的一条记录trajAggrRec表示为:

trajAggrRec=[startDate,startHour,startCluLoc,endCluLoc,flowNum]

其中startDate表示出发日期,startHour表示出发小时,可以从starttTme中提取得到;startCluLoc和endCluLoc表示出发和到达的位置聚类的ID,flowNum表示在某日(startDate)某小时(startHour)内,从startCluLoc内出发到达endCluLoc的人流量;

所述步骤3包括:

按小时构建位置聚类网络序列,表征每小时内各个聚类间的流量关系;假设Gτ=(cluLocSet,Eτ)表示在时间步τ下的位置聚类网络,用一个图结构表示;其中位置聚类集合cluLocSet被看作是顶点集合,Eτ为边集合;eijτ∈Eτ表示在时间步τ内从cluLoci出发到达cluLocj的人流量,具体的值从trajAggrRec中查询得到;然后按小时构建位置聚类网络序列NS={G1,G2,...,GT},T为所有时间步的总数,由待分析的时间段内的日期数d决定,T=24×d;

所述步骤4包括:

步骤4.1:基于位置聚类网络序列,定义LDA模型;LDA模型包含3层:文档、单词和主题;一篇文档是由一组单词构成的集合,所有的文档集构成了一个语料库;一篇文档可以包含多个主题,文档中每一个词都由其中的一个主题生成;将每个时间步下的位置聚类网络Gτ看作是一篇文档,从而位置聚类网络序列NS={G1,G2,...,GT}构成了一个语料库;将边集合Eτ看作是一篇文档Gτ中的单词集合,一条边的权重eijτ对应于一个单词在一篇文档中出现的频率;主题为网络序列中的结构信息,隐含了城市动态相关的、重要的语义信息;

步骤4.2:通过将位置聚类网络定义为文档,将网络中的边关联定义为单词,训练得到一个主题模型,推理OD数据集中隐含的K个主题;采用EM算法训练得到模型参数,EM算法指最大期望算法,采用Gibbs采样计算得到2个概率分布:网络-主题概率分布和主题-边关联概率分布;对于网络-主题概率分布来说,每一个网络代表了一些主题所构成的一个概率分布;用θτ表示网络Gτ的主题概率分布,θτ,k表示主题k在Gτ网络中的概率;对于主题-边关联概率分布来说,由于每一个主题又代表了很多边所构成的一个概率分布,一条边在不同的主题上具有不同的概率;对于主题k,计算得到的边关联概率由表示;在一个主题中,具有高概率的边被认为更能代表那个主题;

步骤4.3:对主题基于重要程度排序;由于每个主题在不同的位置聚类网络中具有不同的概率,一个主题在所有网络中的概率和表征了这个主题的重要程度;对于第k个主题,计算表示第k个主题在所有网络中的概率和;sumProk的值越大,表示对应的主题越重要;在计算得到所有主题的sumProk后,基于此对主题进行重要程度排序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811205749.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top