[发明专利]基于特征组分层和半监督随机森林的鼠标轨迹识别方法有效
申请号: | 201911120434.4 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110879881B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 王茜竹;康璐璐;范兴容;杨晓雅;明蕊 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F21/36 | 分类号: | G06F21/36;G06K9/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 组分 监督 随机 森林 鼠标 轨迹 识别 方法 | ||
本发明涉及大数据分析应用领域,特别是涉及一种基于特征组分层和半监督随机森林的鼠标轨迹识别方法,包括获取鼠标轨迹数据;根据鼠标轨迹数据建立描述人类轨迹特性的基础特征组和强化人机轨迹差异性的辅助特征组;训练多个单视角随机森林模型对未标记样本进行伪标记,筛选出在分类器中达到规定条件的样本,对这些样本进行随机抽取并加入到标记样本中进行分类器的迭代训练;使用扩充样本集的基础特征组和辅助特征组训练多视角随机森林模型,将实时数据输入该模型,判断该操作是人类行为还是机器行为;本发明从海量鼠标轨迹行为中进行人机识别,还能解决鼠标轨迹特征挖掘不充分、数据不平衡、标记样本少等问题,极大地提高了识别性能和识别效率。
技术领域
本发明涉及大数据分析应用领域,特别涉及一种基于特征组分层和半监督随机森林的鼠标轨迹识别方法。
背景技术
现代社会信息化发展节奏逐渐加快,网络安全问题也日益凸显,如,不法分子利用机器人程序自动完成注册、登录、恶意尝试密码等。在这种大环境下,作为互联毛细血管的验证码被赋予了维护网络安全的责任。验证码是用来区分操作对象是人类还是机器的一种技术,它在拦截计算机自动化程序大批量的恶意行为方面,具有非常好的效果,因而许多网站都采用了验证码技术来提高网站的安全性、稳定性、可靠性以及防御网络攻击的能力。
拖拽式验证码是当前应用的比较多的一种验证码,它的使用方式是引导用户通过鼠标拖拽的方式将滑块放到缺失的位置。此类验证码不仅用户使用起来简单,而且极大增加了机器程序破解难度。但攻击者仍可通过非正常手段模拟人类操作行为,绕过验证码的检测,从而黑客工具就可以向系统后台发起批量请求,实现对系统的攻击,从而给系统的正常运行带来很大的风险。因此,如何从海量用户数据中有效检出各种机器行为成为亟待解决的问题。
拖拽式验证码产生的鼠标轨迹是用户进行注册或登录时使用鼠标拖动滑块过程中采样获得的水平方向、垂直方向和时间三个维度的轨迹点集。相较于传统的时间序列数据,鼠标轨迹时间序列数据具有以下六个特点:(1)多变量,即鼠标轨迹包括水平方向x轴、垂直方向y轴和时间t轴3个维度;(2)不规则采样,即由于网络延时等原因,使得每个采样点之间时长不同;(3)长度不等,即由于鼠标轨迹采样间隔不定,导致每一条轨迹的长度不等;(4)变量之间存在关联性,即x-y-t三个维度在时间和空间上存在关联性;(5)数据不平衡,即人类轨迹样本数远多于机器轨迹样本数;(6)标记样本少,即考虑到标记数据获取困难、标记代价高等问题,导致样本数量少。因此,在机器学习领域中,对拖拽式验证码的鼠标轨迹识别可以看作为一种特殊的、以人和机器为标签的时间序列二分类问题,也是一个典型的人机识别问题。
对于这样一种不规则采样、长度不等的时间序列分类问题,目前主要有两类解决方法,第一类是基于模型的方法,该方法的基本思想是将不规则的时间序列转换为规则序列,再使用传统分类器进行分类,但此方法一般都基于二维时间序列,且没有提出数据不平衡、标记样本少时的处理方法,因此不适用于本文鼠标轨迹数据所具有的多变量、变量之间存在关联性、数据不平衡、标记样本少等实际情况。第二类是基于特征的方法,通过选取一组特征来表征时间序列的信息,以此解决时间序列不规则问题,然后在使用机器学习算法进行分类,但这类方法都未能解决数据不平衡、标记样本少等实际问题,且特征工程挖掘不充分,识别效果有限。
发明内容
为解决传统研究方法的不足,本发明针对实际应用及业务场景需求,提出一种基于特征组分层和半监督随机森林的鼠标轨迹识别方法,包括:
S1、获取用户进行操作时鼠标的轨迹数据;
S2、将采集的鼠标轨迹数据中20%作为标记样本集L,80%作为未标记样本集U;`
S3、构建并提取鼠标轨迹特征,包括描述人类轨迹特性的基础特征组和强化人机轨迹差异性的辅助特征组;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911120434.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低压差线性稳压电路
- 下一篇:一种润肤、抗足癣药膏的制备方法