[发明专利]一种基于深度学习的视频异常行为检测方法在审
申请号: | 201711145995.0 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107944373A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 陈华华;雷丽莹;郭春生 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙)33240 | 代理人: | 朱月芬 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 视频 异常 行为 检测 方法 | ||
1.一种基于深度学习的视频异常行为检测方法,其特征在于具体步骤是:
步骤(1)、预处理:
选取待检测视频数据集,将视频中的图像数据帧变成灰度图像,图像尺寸规范化为M×N,M和N分别代表图像的宽和高;将数据集的前P帧作为训练集Y,剩余的Q帧作为测试集T,组成Y的数据都是正常行为的样本数据;
步骤(2)、训练阶段:
步骤(2-1).设Y中第i帧图像为yi;
首先,每隔M1帧连续取k帧图像,即得到作为训练样本一的第i个数据;
其次,每隔M2帧连续取k帧图像,即得到作为训练样本二的第i个数据;
最后,每隔M3帧连续取k帧图像,即得到作为训练样本三的第i个数据;
其中j表示相隔帧数的倍率,j∈[0,k-1];
得到三个训练样本集Y1、Y2、Y3,分别由所有的Y1i、Y2i、Y3i组成,即Y1={Y1i}、Y2={Y2i}、Y3={Y3i};其中0≤i≤P-1-max(M1,M2,M3)×(k-1);
步骤(2-2).以Y1、Y2、Y3作为输入分别送到Alexnet网络中,将网络的第3层输出作为提取的特征,并对得到的特征进行归一化处理,得到三组特征数据集合F1、F2、F3,它们分别由相应的所有样本集数据的特征所组成;
步骤(2-3).为F1、F2、F3的每个特征数据赋予一个标签值,因为训练样本都是正常行为,标签数据分别为L1={1}、L2={1}、L3={1},|L1|=|L2|=|L3|=|F1|=|F2|=|F3|,其中符号“||”表示求集合的元素个数;
步骤(2-4).将三组特征数据F1、F2、F3及其相应的标签数据L1、L2、L3表示为三个样本集:{F1,L1}、{F2,L2}、{F3,L3},作为三组输入分别送到三个一类支持向量机进行训练,得到三个一类支持向量机,分别记做one-SVM1,one-SVM2,one-SVM3;
步骤(3)、测试阶段:
步骤(3-1).设T中第n帧图像为tn;
首先,每隔M1帧连续取k帧图像,即得到作为测试样本一;
其次,每隔M2帧连续取k帧图像,即得到作为测试样本二;
最后,每隔M3帧连续取k帧图像,即得到作为测试样本三;
其中0≤n≤Q-1-max(M1,M2,M3)×(k-1),j表示相隔帧数的倍率,j∈[0,k-1];
步骤(3-2).以T1n、T2n、T3n作为输入分别送入训练阶段步骤(2-1)的Alexnet中,将网络的第3层输出作为提取的特征,并对得到的特征进行归一化处理,得到三组特征数据TF1n、TF2n、TF3n;
步骤(3-3).为待测试特征TF1n、TF2n、TF3n设定一个初始标签值,记为TL1n=1、TL2n=1、TL3n=1;
步骤(3-4).将三组特征数据TF1n、TF2n、TF3n及其相应的标签值TL1n、TL2n、TL3n表示为三个输入样本:{TF1n,TL1n}、{TF2n,TL2n}、{TF3n,TL3n},作为三组输入分别送到one-SVM1、one-SVM2、one-SVM3中进行检测,输出三个测试样本的分类标签值,若分类标签值等于1表示模型检测出该帧图像为正常帧,分类标签值等于-1则表示模型检测出该帧为异常帧;
步骤(3-5).对三个分类标签值进行投票,投票规则是:如果三个分类标签值中有任意两个或两个以上的值为1,则最终输出结果为1,表示该帧图像的人群行为正常;如果三个分类标签值中有任意两个或两个以上的值为-1,则最终输出结果为-1,表示该帧图像的人群行为异常,从而得到最终标签输出,得到模型的检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711145995.0/1.html,转载请声明来源钻瓜专利网。