[发明专利]基于Spark的校园卡租借行为检测方法及系统有效
申请号: | 202011553092.8 | 申请日: | 2020-12-24 |
公开(公告)号: | CN112667709B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 于磊磊;李永在;乔禹 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06F16/25;G06F16/22;G06F16/27;G06K9/62;G06Q50/20 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 spark 校园卡 租借 行为 检测 方法 系统 | ||
本发明公开了基于Spark的校园卡租借行为检测方法及系统,获取用户对校园卡的使用数据,将获取数据作为待检测数据;获取经过人工筛选的标记为租借的用户对校园卡的使用数据,将获取的数据作为标定数据;将待检测数据转化为待检测行为数据集,将标定数据转化为标定行为数据集;对待检测行为数据集和标定行为数据集中的类别特征进行量化处理,进而对所有特征进行标准化处理;采用Spark并行计算标定行为数据集中各个特征的权重;并行加权重计算待检测行为数据与标定行为数据集中所有数据之间的距离;按照待检测行为数据与标定行为数据之间距离由小到大进行排序,选择前K个标定行为数据进行高斯权重加权投票,得到待检测行为数据的类别。
技术领域
本申请涉及异常行为数据检测技术领域,特别是涉及基于Spark的校园卡租借行为检测方法及系统。
背景技术
本部分的陈述仅仅是提到了与本申请相关的背景技术,并不必然构成现有技术。
现有的校园卡管理中,存在校园卡的租借行为,为了及时发现并制止这种行为,学校的校园卡管理部门需要设置一套校园卡租借行为检测方法,但是目前的校园卡租借检测,凭借人工经验来筛查标注,容易出现误检和漏检的现象,造成校园卡的使用混乱现象频发,影响校园卡正常使用者的权益。
发明内容
为了解决现有技术的不足,本申请提供了基于Spark的校园卡租借行为检测方法及系统;
第一方面,本申请提供了基于Spark的校园卡租借行为检测方法;
基于Spark的校园卡租借行为检测方法,包括:
获取用户对校园卡的使用数据,将获取的数据作为待检测数据;
获取经过人工筛选的标记为租借的用户对校园卡的使用数据,将获取的数据作为标定数据;将待检测数据转化为待检测行为数据集,将标定数据转化为标定行为数据集;
分别对待检测行为数据集和标定行为数据集中的类别特征进行量化处理;分别对待检测行为数据集和标定行为数据集中的所有特征进行标准化处理;
采用Spark引擎,并行计算标定行为数据集中各个特征的权重;
采用Spark引擎,并行加权重计算待检测行为数据与标定行为数据集中所有数据之间的距离;
按照待检测行为数据与标定行为数据之间距离由小到大进行排序,选择前K个标定行为数据进行高斯权重加权投票,得到待检测行为数据的类别。
第二方面,本申请提供了基于Spark的校园卡租借行为检测系统;
基于Spark的校园卡租借行为检测系统,包括:
数据获取模块,其被配置为:获取用户对校园卡的使用数据,将获取的数据作为待检测数据;获取经过人工筛选的标记为租借的用户对校园卡的使用数据,将获取的数据作为标定数据;将待检测数据转化为待检测行为数据集,将标定数据转化为标定行为数据集;
数据预处理模块,其被配置为:分别对待检测行为数据集和标定行为数据集中的类别特征进行量化处理;分别对待检测行为数据集和标定行为数据集中的所有特征进行标准化处理;
权重计算模块,其被配置为:采用Spark引擎,并行计算标定行为数据集中各个特征的权重;
距离计算模块,其被配置为:采用Spark引擎,并行加权重计算待检测行为数据与标定行为数据集中所有数据之间的距离;
投票选举模块,其被配置为:按照待检测行为数据与标定行为数据之间距离由小到大进行排序,选择前K个标定行为数据进行高斯权重加权投票,得到待检测行为数据的类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011553092.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种节能型浴室余热回收系统
- 下一篇:一种倒相管及应用其的倒相式音箱