[发明专利]基于分层岭回归算法的警情预测方法和预测系统在审
| 申请号: | 201910864183.4 | 申请日: | 2019-09-12 |
| 公开(公告)号: | CN110674981A | 公开(公告)日: | 2020-01-10 |
| 发明(设计)人: | 王海荣;肖万来;李鑫;桑燕五 | 申请(专利权)人: | 中科曙光南京研究院有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26 |
| 代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 常虹 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 警情 小区 预测模型 预测 属性数据 训练样本 分层 标准化处理 采集数据 地址字段 回归模型 数据清洗 数量预测 预测系统 算法 社区 采集 回归 分析 | ||
本发明公开了一种基于分层岭回归算法的警情预测方法和预测系统,其中警情预测方法包括:1、采集小区、社区、派出所的历史属性数据和小区的警情数量,对采集数据进行数据清洗,并将地址字段进行标准化处理;2、确定训练样本:3、基于分层岭回归模型建立警情预测模型,并采用训练样本对警情预测模型进行训练;4、获取待预测小区的属性数据,将其输入训练好的警情预测模型中,得到待预测小区的警情数量预测值。该方法从派出所、社区、小区三个层次来分析各层属性对小区警情数量的影响,能够实现小区警情数量的准确预测。
技术领域
本发明属于大数据分析技术领域,具体涉及一种采用大数据技术进行警情预测的方法和系统。
背景技术
巡防工作是人民警察的第一勤务,是公安机关的职责所在。在以往的基层实战中,大多高度依赖所队“指挥官”的个人经验预判警情多发区域,对这些区域加强巡防,巡防策略缺少科学决策。随着大数据技术的发展,越来越多的地方公安发挥自身的大数据资源优势,通过机器学习、云计算等手段辅助决策,预测警情多发区域,优化巡防策略。然而,当前警情预测方法大多从历史警情出发,通过时间序列等方法预测特定区域的未来警情。为了预测小区的警情,现有方法通常将每个小区作为独立的样本个体进行分析,没有考虑小区所在社区,及所属派出所等上级区划对小区的影响,预测结果准确度不高。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供了一种警情预测方法,该方法从派出所、社区、小区三个层次来分析各层属性对小区警情数量的影响,能够实现小区警情数量的准确预测。
技术方案:本发明一方面公开了一种基于分层岭回归算法的警情预测方法,包括如下步骤:
(1)采集小区、社区、派出所的历史属性数据和小区的警情数量,对采集数据进行数据清洗,并将地址字段进行标准化处理;
(2)确定训练样本:步骤1处理后的数据按照时间区间分为N组,将每组数据的属性平均值和警情数量平均值作为训练样本,构成有N个样本的训练集;本发明中按照自然月为单位将采集的数据分为N组;
(3)基于分层岭回归模型建立警情预测模型,所述警情预测模型为:
SI=α0+α1x1+α2x2+…+αlxl
αi=βi0+βi1y1+βi2y2+…+βimym
βij=γij0+γij1z1+γij2z2+…+γijnzn
其中x1,x2,…,xl为小区h的属性数据,y1,y2,…,ym为小区h所属的社区c(h)的属性数据;z1,z2,…,zn为社区c(h)所对应派出所的属性数据,SI为小区h的警情数量;l,m,n分别为小区、社区、派出所的属性数量;αi,βij,γijk为警情预测模型的回归系数;i=0,1,…,l,j=0,1,…,m,k=0,1,…,n;
利用训练样本对警情预测模型进行训练,通过最小化损失函数来确定回归系数;所属损失函数L(α,β,γ)为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科曙光南京研究院有限公司,未经中科曙光南京研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864183.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





