[发明专利]基于分层岭回归算法的警情预测方法和预测系统在审
| 申请号: | 201910864183.4 | 申请日: | 2019-09-12 |
| 公开(公告)号: | CN110674981A | 公开(公告)日: | 2020-01-10 |
| 发明(设计)人: | 王海荣;肖万来;李鑫;桑燕五 | 申请(专利权)人: | 中科曙光南京研究院有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26 |
| 代理公司: | 32204 南京苏高专利商标事务所(普通合伙) | 代理人: | 常虹 |
| 地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 警情 小区 预测模型 预测 属性数据 训练样本 分层 标准化处理 采集数据 地址字段 回归模型 数据清洗 数量预测 预测系统 算法 社区 采集 回归 分析 | ||
1.基于分层岭回归算法的警情预测方法,其特征在于,包括如下步骤:
(1)采集小区、社区、派出所的历史属性数据和小区的警情数量,对采集数据进行数据清洗,并将地址字段进行标准化处理;
(2)确定训练样本:步骤1处理后的数据按照时间区间分为N组,将每组数据的属性平均值和警情数量平均值作为训练样本,构成有N个样本的训练集;
(3)基于分层岭回归模型建立警情预测模型,所述警情预测模型为:
SI=α0+α1x1+α2x2+…+αlxl
αi=βi0+βi1y1+βi2y2+…+βimym
βij=γij0+γij1z1+γij2z2+…+γijnzn
其中x1,x2,…,xl为小区h的属性数据,y1,y2,…,ym为小区h所属的社区c(h)的属性数据;z1,z2,…,zn为社区c(h)所对应派出所的属性数据,SI为小区h的警情数量;l,m,n分别为小区、社区、派出所的属性数量;αi,βij,γijk为警情预测模型的回归系数;i=0,1,…,l,j=0,1,…,m,k=0,1,…,n;
利用训练样本对警情预测模型进行训练,通过最小化损失函数来确定回归系数;所属损失函数L(α,β,γ)为:
其中SI(p)为警情预测模型根据训练集中第p个训练样本中的属性数据预测得到的警情数量;W(p)为训练集中第p个训练样本中的警情数量;
(4)获取待预测小区的属性数据,将其输入训练好的警情预测模型中,得到待预测小区的警情数量预测值。
2.根据权利要求1所述的警情预测方法,其特征在于,所述小区的属性包括:
(a)人口结构信息;所述人口结构信息包括以下(a1)-(a4)的一项或多项:
(a1)流动人口数量;
(a2)流动人口比例;
(a3)重点人员数量;
(a4)流动人口与常住人口中以下信息的一项或多项:
各文化程度人口的比例、平均家庭人口数、党员比例、8岁以下儿童人口比例、8到15岁青少年人口比例、15岁到30岁青年人口比例、30到60岁中年人口比例、60岁以上老年人口比例、少数民族人口比例、拥有社保人数比例、人员居住时长;
所述重点人员是公安根据业务规则制定的人员;所述文化程度包括:文盲,小学,初中,高中,大学及大学以上;
(b)车辆信息;所述车辆信息为小区住户拥有的机动车辆数;
(c)房屋信息;所述房屋信息包括以下一项或多项:小区内部监控点数量、小区房屋均价、在租房屋数量、小区自来水用水量;
(d)治安信息;所述治安信息为巡防频率;
所述社区的属性包括以下一项或多项:房产数量、娱乐场所数量、第一产业从业人口比例、第二产业从业人口比例、第三产业从业人口比例;所述娱乐场所包括洗浴中心、网吧、棋牌室、KTV;
所述派出所的属性包括:接警数量、处警数量、警员人数,巡防人次,过车数量;所述过车数量为所述派出所辖区内车辆卡口采集的每个月外地车辆、本地车辆的车辆数。
3.根据权利要求1所述的警情预测方法,其特征在于,所述地址标准化包括:
(1.1)根据待预测地区内的地点名词建立地点名词词库和层级行政区划库;
(1.2)将地点名词词库作为词典库,对采集数据中的地址字段分词,提取分词结果;
(1.3)提取出的地点名词映射到标准地址;所述标准地址包括小区字段、社区字段和派出所字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科曙光南京研究院有限公司,未经中科曙光南京研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864183.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





