[发明专利]一种运用大数据技术构建区域画像分析模型的方法在审
| 申请号: | 201910249179.7 | 申请日: | 2019-03-29 |
| 公开(公告)号: | CN109947826A | 公开(公告)日: | 2019-06-28 |
| 发明(设计)人: | 王晓芹;李冬;张新惠;张兆勇 | 申请(专利权)人: | 山东浪潮云信息技术有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/25;G06F16/29;G06F16/21 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
| 地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 大数据 画像 分析模型 技术构建 统计分析 可视化技术 人口 公共安全 基础设施 快速分析 人口流动 资源分配 固定的 综合分析 社区 标签 直观 社会治安 便利 居住 分析 服务 | ||
1.一种运用大数据技术构建区域画像分析模型的方法,其特征在于,
通过在地图上任意划取一个区域或者选择固定的社区或者区县,实时对该区域内居住人口、工作人口、企业、基础设施、公共安全进行统计分析,形成直观的统计分析;分析出该地区内包含人口综合分析、人口流动趋势、社区比较、社会治安的区域画像。
2.根据权利要求1所述的方法,其特征在于,
首先从公安系统获取海量数据,并将该海量数据迁移至分布式存储系统HDFS中,应用分布式计算引擎Spark进行实时计算。
3.根据权利要求2所述的方法,其特征在于,
对存储的数据利用地图API将户籍信息、居住信息,企业信息中的地址转换为经纬度,并永久存储在对应的表中,为后续判断人口企业是否在所选区域内提供计算指标。
4.根据权利要求3所述的方法,其特征在于,
通过在前端地图上划取任意区域或者选择预先设定好的区县和社区,调用地图API获取区域顶点坐标信息,将坐标信息处理为特定的格式并传给后台,后台程序调用分布式实时计算系统spark的JDBC接口,并传入该区域的坐标信息参数;判断坐标是否在区域内,筛选出该区域内的人口和企业,对筛选出的数据通过预先设计好的模型进行统计分析。
5.根据权利要求4所述的方法,其特征在于,
调用地图提供的API接口进行二次开发,实现在地图上自由绘制区域,并且能够将绘制的图形处理成经纬度的格式传给后台。
6.根据权利要求5所述的方法,其特征在于,
利用地图API对人口、公司对应的地址解析为经纬度,并保存至数据库。
7.根据权利要求6所述的方法,其特征在于,
利用数据传输工具Sqoop,将关系型数据库内的海量数据以及解析的地址数据迁移至分布式存储系统。
8.根据权利要求7所述的方法,其特征在于,
对数据进行ETL操作,利用人口数据与社保数据,将人员与公司信息,工资情况一一对应起来。
9.根据权利要求8所述的方法,其特征在于,
建立区域画像分析模型,在地图上绘制一个区域坐标的经纬度信息,判断经纬度点是否在地图区域内,筛选出落在该区域内的居住人口和工作人口,对删选的数据进行统计分析,完成区域画像指标分析;获取区域画像分析模型的分析结果,利用地图技术,在地图上以图表来展示。
10.根据权利要求9所述的方法,其特征在于,
操作步骤如下:
1)、开发地图绘图工具;
2)、采集人口、企业、社保等数据并将数据迁移至分布式存储系统;
3)、运用地图API解析地址,将地址解析为经纬度信息并保存;
4)、开发对数据进行过滤、提取,利用人口数据与社保数据,将人员与公司信息一一对应起来的ETL脚本;
5)、判断经纬度点是否在地图区域内;
6)、根据返回的区域经纬度信息,结合点落入区域算法,获取区域内人口、公司数据;
7)、利用spark开发分布式计算程序;
8)、利用上一步分布式计算程序,结合计算出的数据进行区域画像的统计分析;
9)、将计算出的区域画像模型数据在地图上绘制展示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮云信息技术有限公司,未经山东浪潮云信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910249179.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用户资产交易数据处理方法及装置
- 下一篇:一种查询操作的响应方法和装置





