[发明专利]一种动态的基于大数据技术的场所出入次数异常计算方法在审
| 申请号: | 202010359983.3 | 申请日: | 2020-04-30 |
| 公开(公告)号: | CN111552681A | 公开(公告)日: | 2020-08-18 |
| 发明(设计)人: | 苏航;李松和;武传涛;刘瑞欣;张法宝 | 申请(专利权)人: | 山东众志电子有限公司 |
| 主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/27;G06F16/215;G06F16/28 |
| 代理公司: | 济南誉丰专利代理事务所(普通合伙企业) 37240 | 代理人: | 于洪伟 |
| 地址: | 271000 山东省泰安市高新*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 动态 基于 数据 技术 场所 出入 次数 异常 计算方法 | ||
1.一种动态的基于大数据技术的场所出入次数异常计算方法,其特征在于,通过如下步骤实现:
大数据迁移和清洗,将RDBMS中的用户出入记录数据迁移到Hadoop大数据集群的Hive数据仓库中,使用HDFS文件系统的MapReduce分布式计算进行批处理,将重复数据和无效数据去除;
聚合某个场所每日进/出的次数的均值,在Hive数据仓库中,基于YARN计算引擎,采用MapReduce分布式计算,根据公式r=c/m,得到某个场所每天的平均进/出的次数,并将该平均值作为新的列项添加到过程表中,其中,c是该场所当日进/出次数的总数,m是该场所当日进/出的总人次,r是该场所当日进/出次数的平均值;
聚合每人每日进/出每个场所的次数,使用HQL语句聚合出某场所每个人每日进/出的次数xi;
计算某场所每日进/出次数的标准差,公式(一)为标准差的计算公式,公式(二)为标准差平方的公式,得到方差,其中xi为某人某日在某场所进/出的总次数, r 为某场某日进/出次数的平均值, n 为某场所某日进/出的总人数
公式(一):
公式(二):s2=[ (x1-r)2 + (x2-r)2 + ...... + (xn-r)2 ] / (n)
人员某日进/出某个场所的次数异常判断,将异常值定义如下公式(三)所示,公式(三):|x - r| 2 × σ(r),
公式(四):|x - r|2 4 × s2,
其中各参数代表内容见步骤4)中的公式(一)和公式(二),满足公式(四)的x值,即为异常进/出次数,对应的人员、日期、场所信息都输出到异常进/出数据库表中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众志电子有限公司,未经山东众志电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010359983.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种激光三角法位移传感器的标定方法
- 下一篇:一种胶带机减速器油位检测装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





