[发明专利]一种基于无监督聚类模式的学生异常行为模式分析方法有效
申请号: | 201910101560.9 | 申请日: | 2019-02-01 |
公开(公告)号: | CN109977132B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 孔德慧;于沁杨;张勇;李新海;代晋玮 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/26 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 张慧 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 模式 学生 异常 行为 分析 方法 | ||
1.一种基于无监督聚类模式的学生异常行为模式分析方法,其特征在于,包括以下步骤:
步骤1:学生异常行为关键特征提取
所述关键特征包括:学生属性维度、消费规律特征、时间空间维度特征、社交活动特征;学生属性维度包含学生卡号Studentid、学生卡平均使用次数AvgCarduse、学生卡交易金额TransMoney;消费规律特征包含高峰时段消费HotTimeFre、正常消费次数NorUseFre;时间空间维度特征包含活动地点熵值LocDiff、活动时间熵值TimeDiff;社交活动特征包括个人社交网络大小MatSocLength、个人社交频率MatSocFre;基于上述9维关键活动特征指标为每一个体构建活动特征序列,以量化其在校行为规律;
步骤2:基于无监督聚类方式的学生异常类提取
使用K-Means算法针对选取样本进行聚类分析,通过对K进行赋值进行聚类数目的判定,通过聚类的方式在高维度空间中具有相同或相似特征模式的个体将被分为一类,并且通过类内凝聚度以及类间凝聚度进行聚类效果的衡量;并利用相对异常算法ROCF计算突变异常类,判断所得类目为异常类或混合类;ROCF即Relative outlier cluster factor;
步骤3:基于局部异常因子算法的分组别异常个体行为分析
基于提取的异常类与混合类,针对类内个体进行逐一分析,对于个体属于纯异常类的认定为异常个体;针对混合类使用步骤1中所提个体特征作为计算指标,使用基于密度的度量方法LOF来判定混合类内的个体;
LOF即local outlier factor算法是一种基于密度的算法,其思想是计算所有所有点的第K近距离,并计算局部密度,通过局部密度的倒数与局部密度的平均值进行比较得出个体点的离群指数,其计算公式见式(9),
其中,分子部分包括所有点的局部密度的平均值,通过平均值与该点的可达密度做商,比值越接近1说明个体点的密集程度和正常点相近,而当比值小于1说明该点密度较其他点更高,而当比值大于1说明这个点密度高于其他邻域点,此点可被认为是异常点;
通过对个体LOF的计算确定个体是否异常,通过异常个体与校园其他数据结合以及调查咨询方式进行个体验证,并根据小概率事件因素设定相应的LOF阈值,在此阈值之上个体被认定为行为异常个体,将进行标记;
步骤4:基于时空关联分析的异常群体检测
通过对异常类及异常个体的挖掘与判定,将获得在行为上带有异常标签的个体,通过度量全体学生样本中与异常标签个体具有相似性,来构建基于时空关联的学生活动关联分析图,用来判断学生共有的学生行为模式,以及判定学生样本中存在的潜在异常群体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910101560.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种房型匹配系统
- 下一篇:一种智能换油方法及装置