[发明专利]一种城市热点事件动态监测方法及系统有效
申请号: | 201711216306.0 | 申请日: | 2017-11-28 |
公开(公告)号: | CN107908766B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 李峰;司马晓;黄卫东;单樑;李晨 | 申请(专利权)人: | 深圳市城市规划设计研究院有限公司 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F17/27;G06Q50/00 |
代理公司: | 44205 广州嘉权专利商标事务所有限公司 | 代理人: | 唐致明<国际申请>=<国际公布>=<进入 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 城市 热点 事件 动态 监测 方法 系统 | ||
1.一种城市热点事件动态监测方法,其特征在于,其包括步骤:
S1,获取社交媒体数据中的热词;
S2,将城市进行划分成单元,计算单元内热词的分布概率,得到城市热点事件中热词的空间分布;
S3,计算相邻时间间隔内热词的相对距离,确定城市热点事件动态变化的空间范围;
其中,所述步骤S1包括子步骤:
S11,通过社交媒体网站的应用程序编程接口API获取社交媒体数据;
S12,获取社交媒体数据发布的时间信息,在社交媒体数据发布的时间范围T内,划分n+1个时间间隔ti,其中,T=(t1,t2,t3,...ti...tn,tn+1),获取每个时间间隔ti内社交媒体数据的文本内容;
S13,计算时间间隔t1到tn-1内文本内容的平均词频,依据平均词频提取时间间隔tn内城市热点事件的热词;
其中,所述步骤S13具体为:计算时间间隔t1到tn-1内文本内容的平均词频,依据平均词频提取时间间隔tn内城市热点事件的热词,时间间隔t1到tn-1内文本内容的平均词频的计算公式为:
其中,C为社交媒体数据中文本内容的词语,|Ci|为时间间隔ti内词语C出现的频率,若时间间隔tn内文本内容的平均词频history[Cn]>history[Cn-1],则定义该词语C为城市热点事件的热词w;
其中,所述步骤S2包括子步骤:
S21,将城市划分为若干个网格单元g,依据步骤S1提取每个网格单元内的热词;
S22,计算每个网格单元内热词w的密度,得到所述热词w在网格单元g内的分布概率;
S23,对空间位置进行划定,识别所述热词w对应城市热点事件的空间分布;
热词w的密度计算公式为:
其中,为网格单元g中热词w的个数,G为研究城市内的全部网格单元,且g∈G;
其中,所述步骤S23具体为:对空间位置进行划定,计算空间位置划定的置信度αw[l],空间位置划定的置信度αw[l]的公式为:
其中,gr为所述热词w共同出现的网格单元的位置信息,Ωw[gr]为所述热词w与所述网格单元的位置信息gr共同出现的频数,l为热词w的地理位置,划分的空间位置g'为置信度αw[l]下、热词w在研究城市内的全部网格单元G的集合,基于划分的空间位置g',所述热词w在空间位置g'内的分布概率为:
定义分布概率的阈值为β,提取所在网络单元作为城市热点事件的空间分布,城市热点事件的中心位置(lata,lona)为所在网络单元中心点。
2.根据权利要求1所述的一种城市热点事件动态监测方法,其特征在于,所述社交媒体数据包括新浪微博数据、Twitter数据、Facebook数据。
3.根据权利要求1所述的一种城市热点事件动态监测方法,其特征在于,所述步骤S3包括子步骤:
S31,根据步骤S13,提取时间间隔tn+1内的热词w',计算热词w'的加权重心,得到时间间隔tn+1内的热词w'的中心位置;
S32,应用半正矢公式,计算时间间隔tn+1内热词w'与时间间隔tn内热词w的相对距离,确定城市热点事件动态变化的空间范围。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市城市规划设计研究院有限公司,未经深圳市城市规划设计研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711216306.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种游戏资源处理方法、移动终端及服务器
- 下一篇:网站底部内链处理方法及装置