[发明专利]基于特征组分层和半监督随机森林的鼠标轨迹识别方法有效
申请号: | 201911120434.4 | 申请日: | 2019-11-15 |
公开(公告)号: | CN110879881B | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 王茜竹;康璐璐;范兴容;杨晓雅;明蕊 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F21/36 | 分类号: | G06F21/36;G06K9/62 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 组分 监督 随机 森林 鼠标 轨迹 识别 方法 | ||
1.基于特征组分层和半监督随机森林的鼠标轨迹识别方法,其特征在于,包括以下步骤:
S1、获取用户进行操作时鼠标的轨迹数据;
S2、将采集的鼠标轨迹数据中20%作为标记样本集L,80%作为未标记样本集U;`
S3、构建并提取鼠标轨迹特征,包括描述人类轨迹特性的基础特征组和强化人机轨迹差异性的辅助特征组,描述人类轨迹特性的基础特征组的特征包括:
鼠标轨迹水平坐标最大值与目标值之差xovs和水平坐标最大值与最小值之差xdiffer;
鼠标轨迹水平坐标一阶差分最小值dxmin和水平坐标一阶差分标准差dxstd;
回退轨迹水平坐标一阶差分最小值dx'min和回退轨迹水平坐标一阶差分中程数dx'mid;
回退轨迹速度最大值v'max和回退轨迹速度末尾值v'end;
回退轨迹速度一阶差分最大值dv'max和回退轨迹点个数x'num;
其中,回退轨迹为拖离目标点后重新拖动回来产生的轨迹,无回退轨迹则取轨迹尾部10个点;
强化人机轨迹差异性的辅助特征组的特征包括:
垂直坐标最小值ymin和垂直坐标改变次数ychg;
垂直坐标一阶差分初始值dyinit;
采样时间初始值init,采样时间中位数tmed和鼠标第一次移动到目标点所需时间taim;
采样时间一阶差分初始值dtinit;
S4、将标记样本集L以bootstrap的方式采样N份,使用这N份样本集的基础特征组训练多个单视角随机森林分类器{R1,R2,...,RN};
S5、用训练好的N个分类器分别对原始标记样本集进行预测,计算分类器当前分类误差率e,若ee',则直接输出扩充后的标记样本集L并转到步骤S9,否则转到S6;
S6、用训练好的N个分类器分别对未标记样本集U进行预测,计算未标记样本集U中的每个未标记样本xu在N个分类器中的预测置信度和伪标签;
S7、根据预测置信度和伪标签筛选未标记样本,按照标记样本的类别比率对其进行随机抽取,将抽取到的未标记样本及其伪标签加入到标记样本中,进行标记样本的更新,并将这些样本从未标记样本集U中剔除;
S8、如果标记样本的数量不再改变满足终止条件,则停止迭代,输出扩充后的标记样本集;如果不满足,则重复S4~S7;
S9、使用扩充样本集的基础特征组和辅助特征组训练多视角随机森林模型,将实时鼠标轨迹数据输入完成训练的多视角随机森林模型,完成对鼠标轨迹的人机识别;
其中,e'为分类器在上一次迭代的误差率。
2.根据权利要求1所述的基于特征组分层和半监督随机森林的鼠标轨迹识别方法,其特征在于,获取用户进行操作时鼠标的轨迹数据包括采集m个用户从开始操作验证码到结束的鼠标轨迹,得到轨迹数据D=[S1,S2,...,Sm],每条轨迹Si都包含采样时间ti=[ti1,ti2,...ti|si|]以及相应的水平坐标xi=[xi1,xi2,...xi|si|]和垂直坐标yi=[yi1,yi2,...yi|si|],轨迹目标点坐标(xa,ya)以及类别标签label,当类别标签label=0时表示机器轨迹,当类别标签label=1时表示人类轨迹。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911120434.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种低压差线性稳压电路
- 下一篇:一种润肤、抗足癣药膏的制备方法