[发明专利]基于Spark的校园卡租借行为检测方法及系统有效

专利信息
申请号: 202011553092.8 申请日: 2020-12-24
公开(公告)号: CN112667709B 公开(公告)日: 2022-05-03
发明(设计)人: 于磊磊;李永在;乔禹 申请(专利权)人: 山东大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/28;G06F16/25;G06F16/22;G06F16/27;G06K9/62;G06Q50/20
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 黄海丽
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 spark 校园卡 租借 行为 检测 方法 系统
【权利要求书】:

1.基于Spark的校园卡租借行为检测方法,其特征是,包括:

获取用户对校园卡的使用数据,将获取的数据作为待检测数据;

获取经过人工筛选的标记为租借的用户对校园卡的使用数据,将获取的数据作为标定数据;将待检测数据转化为待检测行为数据集,将标定数据转化为标定行为数据集;

分别对待检测行为数据集和标定行为数据集中的类别特征进行量化处理;分别对待检测行为数据集和标定行为数据集中的所有特征进行标准化处理;

采用Spark引擎,并行计算标定行为数据集中各个特征的权重;

采用Spark引擎,并行加权重计算待检测行为数据与标定行为数据集中所有数据之间的距离;

按照待检测行为数据与标定行为数据之间距离由小到大进行排序,选择前K个标定行为数据进行高斯权重加权投票,得到待检测行为数据的类别;

按照待检测行为数据与标定行为数据之间距离由小到大进行排序,选择前K个标定行为数据进行高斯权重加权投票,得到待检测行为数据的类别;具体步骤包括:

基于K-D树的无类别最近邻集合快速获取算法,快速获取待检测行为数据与标定行为数据集的前K个最近邻数据;

根据待检测行为数据与K个标定行为数据的距离,对K个标定行为数据采用高斯函数逐个加权;

根据K个标定行为数据的权重和类别标记进行投票选举;

所述基于K-D树的无类别最近邻集合快速获取算法;还包括:

第一步,建立K-DTree:K-D树;U:待检测数据;K:最近邻数量;D:回溯阈值;建立输出变量Node[h]:邻居节点集;

第二步,通过二叉树搜索,在K-D Tree上找到U的最近邻点N;如果N的左右子树空间中存在比N更近的样本节点N*,则停止本轮搜索,将N*加入Node[h],否则将N加入Node[h];

第三步,向上回溯,设置N为N的父样本节点,重复第二步h轮,直到回溯深度达到给定阈值D;

第四步,输出Node[h],算法结束;

所述采用高斯函数加权,即采用高斯函数对标定行为数据进行加权,对于第i个标定行为数据Ni,其计算如下所示:

其中,di为邻居样本Ni与待分类样本的距离,考虑投票权重的计算,设置a=1,b=0,c设置为可调参数;

所述投票选举,即通过加权重的类别投票选举待检测行为数据的类别,投票选举计算如下:

其中,

其中,K为邻居数量,L为类别数量,Cj为第j个类别,fij为类别归属标识。

2.如权利要求1所述的基于Spark的校园卡租借行为检测方法,其特征是,

将待检测数据转化为待检测行为数据集;具体步骤包括:

待检测数据,包括:账号、学号、姓名、性别、学院、身份类型、交易金额、交易商户和交易时间;

对待检测数据进行特征提取,得到待检测数据特征;所述待检测数据特征,包括:性别、身份、是否毕业班、总消费金额、总消费次数、餐饮消费金额、洗浴消费金额、洗浴消费占比、健身消费占比、是否有学习相关技术以及是否有医疗相关记录;

将待检测数据特征按照用户编号进行存储,得到待检测行为数据集。

3.如权利要求1所述的基于Spark的校园卡租借行为检测方法,其特征是,

将标定数据转化为标定行为数据集;具体步骤包括:

标定数据,包括:账号、学号、姓名、性别、学院、身份类型、交易金额、交易商户、交易时间和是否存在租借行为的标签;

对标定数据进行特征提取,得到标定数据特征;所述标定数据特征,包括:性别、身份、是否毕业班、总消费金额、总消费次数、餐饮消费金额、洗浴消费金额、洗浴消费占比、健身消费占比、是否有学习相关技术、是否有医疗相关记录和是否存在租借行为的标签;

将标定数据特征按照编号进行存储,得到标定行为数据集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011553092.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top