[发明专利]一种多尺度鼠标轨迹特征提取方法、装置和系统有效
| 申请号: | 201710817777.0 | 申请日: | 2017-09-12 |
| 公开(公告)号: | CN107609590B | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 王红;孟广婷;于晓梅;胡晓红;何天文;狄瑞彤;周莹;房有丽;刘海燕;王露潼;王倩;宋永强 | 申请(专利权)人: | 山东师范大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 黄海丽 |
| 地址: | 250014 *** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 尺度 鼠标 轨迹 特征 提取 方法 装置 系统 | ||
本发明涉及一种多尺度鼠标轨迹特征提取方法,装置及系统,方法包括采集鼠标轨迹,得到鼠标轨迹表达,将鼠标轨迹表达分为训练集和测试集;对训练集数据首先进行基准尺度特征提取,在基准尺度特征的基础上,选取每一基准尺度特征对应的细分尺度特征,同时提取鼠标轨迹表达中的局部轨迹特征;采用分层随机森林选取所述基准尺度特征、细分尺度特征和局部轨迹特征中的优势特征;利用所述优势特征,以训练集为样本构造并行投票决策树,并对测试集中的鼠标轨迹进行分类识别。
技术领域
本发明涉及一种多尺度鼠标轨迹特征提取方法、装置和系统。
背景技术
鼠标轨迹特征是鼠标轨迹识别任务必需的基础,提取多尺度鼠标轨迹特征是对鼠标轨迹进行后续处理前最重要的准备工作。目前,对鼠标轨迹特征提取的方法主要有:根据鼠标轨迹的速度、距离、单击次数等几个固定参数提取鼠标轨迹特征的方法;使用切割鼠标轨迹为等距离的线段,以这些线段的特征作为依据进行鼠标轨迹特征提取的方法;使用层次划分方法,对不同的鼠标行为定义不同特征的灵活标准提取鼠标轨迹特征的方法等等。但是,在实际中,由于鼠标轨迹特征的尺度和重要度不同,并且鼠标轨迹的局部特征意义明显,人为指定特征缺乏客观性,又难以找到具有通用性的鼠标轨迹特征,上述方法均难以满足通用鼠标轨迹特征提取的需求。目前,基于数据挖掘和机器学习相关理论,采用局部轨迹特征和全局轨迹特征相融合、多尺度特征相融合,提取鼠标轨迹特征的方法尚未出现。
发明内容
针对现有技术中存在的不足,本发明提供了一种多尺度鼠标轨迹特征提取方法,融合了不同尺度的特征,充分挖掘鼠标轨迹特征以支持鼠标轨迹识别任务,具有高准确度和执行效率。
本发明的技术方案为:
一种多尺度鼠标轨迹特征提取方法,包括;
采集鼠标轨迹,得到鼠标轨迹表达,将鼠标轨迹表达分为训练集和测试集;
对训练集数据首先进行基准尺度特征提取,在基准尺度特征的基础上,选取每一基准尺度特征对应的细分尺度特征,同时提取鼠标轨迹中的局部轨迹特征;
采用分层随机森林选取所述基准尺度特征、细分尺度特征和局部轨迹特征中的优势特征;
利用所述优势特征,以训练集为样本构造并行投票决策树,并对测试集中的鼠标轨迹表达进行分类识别。
进一步的,所述采集鼠标轨迹,得到鼠标轨迹表达包括:
采集鼠标轨迹,经过脱敏处理后,得到若干鼠标轨迹点,每个鼠标轨迹点均具有坐标,以及采集该鼠标轨迹点的时间值。
进一步的,对训练集数据首先进行基准尺度特征提取包括:
对鼠标轨迹表达进行以概念为数据尺度的分层划分,得到子数据集,每一层数据尺度中的所有子数据集构成该层的基准尺度数据集,根据基准尺度数据集提取基准尺度特征,所述基准尺度特征至少包括鼠标移动速度、角度、距离和时间中的一种。
进一步的,选取每一基准尺度特征对应的细分尺度特征包括:
针对鼠标移动速度,选取细分尺度特征至少包括:最大值、最小值、均值、极差、方差、标准差、中位数、众数、众数的个数、水平方向速率、竖直方向速率、切向速率、切向加速度中的一种;
针对鼠标移动角度,选取细分尺度特征至少包括:角度变化率、最大值、最小值、均值、极差、方差、标准差、中位数、众数、众数的个数、角速度、曲率、曲率变化率;
针对鼠标移动距离,选取细分尺度特征至少包括:两点间距离、移动距离、直线度、路径抖动、最大值、最小值、均值、极差、方差、标准差、中位数、众数、众数的个数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710817777.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复杂行为序列数据的特征学习方法
- 下一篇:一种图书分级方法和系统





