[发明专利]基于F函数和改进KD树的犯罪大数据点模式分析方法在审
| 申请号: | 201910203946.0 | 申请日: | 2019-03-18 |
| 公开(公告)号: | CN109960702A | 公开(公告)日: | 2019-07-02 |
| 发明(设计)人: | 何雨情;杨立涛;白璐斌;黄舒哲 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62;G06Q50/26 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 并行计算 模式分析 犯罪 点事件 改进 邻近 空间分布模式 并行处理 计算效率 计算资源 数据处理 分簇 分块 构建 分析 | ||
1.一种基于F函数和改进KD树的犯罪大数据点模式分析方法,其特征在于,包括以下步骤:
步骤1:生成随机点集;
输入所有待处理的犯罪事件点,即坐标,设定每个事件点的研究区域半径,基于每一事件点在研究区域内生成随机点集,基于随机点集建立KD树;
步骤2:搜索最邻近点;
在KD树中搜索每个点的最邻近随机点,计算最邻近随机点到事件点之间的距离dmin,直到所有输入的点都计算完毕,得到所有点的最邻近距离;
步骤3:计算F函数;
将得到的所有点的最邻近距离按照大小排序,计算最邻近距离的变程R和组距D,其中R=max(dmin)-min(dmin),根据组距上限值累积计数点的数量,并计算累积频率F(d);
步骤4:进行显著性检验并得到分析结果;
若计算结果满足显著性检验指标,输出F(d)关于距离d的曲线图,判断点数据的空间分布模式;对于F函数来说,如果F函数值开始时增加得较慢,但到距离d较大时,F函数开始快速增加,则判断点事件在空间中趋于聚集分布;如果F函数值开始时增加得较快,距离d较大时增加得较慢,则点事件在空间中趋向分散分布。
2.根据权利要求1所述的基于F函数和改进KD树的犯罪大数据点模式分析方法,其特征在于:步骤1中所述建立KD树,首先计算每一个簇中所有数据的每一维方差,然后选取方差最大的那一维中所有数据的中位数作为分割超面,即根结点,最后确定左子树右子树,递归进行,直到叶子结点。
3.根据权利要求1所述的基于F函数和改进KD树的犯罪大数据点模式分析方法,其特征在于:步骤2中,采用多线程并行搜索在KD树中搜索最邻近点。
4.根据权利要求1所述的基于F函数和改进KD树的犯罪大数据点模式分析方法,其特征在于:步骤3中,用最邻近距离的累积频率分布F(d)描述邻近测度,通过随机点和点事件间的分散程度来描述分布模式;
其中,dmin(pi,S)表示从随机选择的pi点到研究区域的点模式S的最邻近距离,m表示随机点的个数,d是距离。
5.根据权利要求1-4任意一项所述的基于F函数和改进KD树的犯罪大数据点模式分析方法,其特征在于:步骤4中,使用蒙特卡洛随机模拟的方法,若随机模拟分布函数大于上界U(d)的概率和小于下界L(d)的概率符合则计算结果满足显著性检验指标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910203946.0/1.html,转载请声明来源钻瓜专利网。





