[发明专利]一种动态的基于大数据技术的场所出入次数异常计算方法在审

专利信息
申请号: 202010359983.3 申请日: 2020-04-30
公开(公告)号: CN111552681A 公开(公告)日: 2020-08-18
发明(设计)人: 苏航;李松和;武传涛;刘瑞欣;张法宝 申请(专利权)人: 山东众志电子有限公司
主分类号: G06F16/21 分类号: G06F16/21;G06F16/27;G06F16/215;G06F16/28
代理公司: 济南誉丰专利代理事务所(普通合伙企业) 37240 代理人: 于洪伟
地址: 271000 山东省泰安市高新*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 动态 基于 数据 技术 场所 出入 次数 异常 计算方法
【权利要求书】:

1.一种动态的基于大数据技术的场所出入次数异常计算方法,其特征在于,通过如下步骤实现:

大数据迁移和清洗,将RDBMS中的用户出入记录数据迁移到Hadoop大数据集群的Hive数据仓库中,使用HDFS文件系统的MapReduce分布式计算进行批处理,将重复数据和无效数据去除;

聚合某个场所每日进/出的次数的均值,在Hive数据仓库中,基于YARN计算引擎,采用MapReduce分布式计算,根据公式r=c/m,得到某个场所每天的平均进/出的次数,并将该平均值作为新的列项添加到过程表中,其中,c是该场所当日进/出次数的总数,m是该场所当日进/出的总人次,r是该场所当日进/出次数的平均值;

聚合每人每日进/出每个场所的次数,使用HQL语句聚合出某场所每个人每日进/出的次数xi

计算某场所每日进/出次数的标准差,公式(一)为标准差的计算公式,公式(二)为标准差平方的公式,得到方差,其中xi为某人某日在某场所进/出的总次数, r 为某场某日进/出次数的平均值, n 为某场所某日进/出的总人数

公式(一):

公式(二):s2=[ (x1-r)2 + (x2-r)2 + ...... + (xn-r)2 ] / (n)

人员某日进/出某个场所的次数异常判断,将异常值定义如下公式(三)所示,公式(三):|x - r| 2 × σ(r),

公式(四):|x - r|2 4 × s2

其中各参数代表内容见步骤4)中的公式(一)和公式(二),满足公式(四)的x值,即为异常进/出次数,对应的人员、日期、场所信息都输出到异常进/出数据库表中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东众志电子有限公司,未经山东众志电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010359983.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top